Το περιεχόμενο παρέχεται από το iwashi. Όλο το περιεχόμενο podcast, συμπεριλαμβανομένων των επεισοδίων, των γραφικών και των περιγραφών podcast, μεταφορτώνεται και παρέχεται απευθείας από τον iwashi ή τον συνεργάτη της πλατφόρμας podcast. Εάν πιστεύετε ότι κάποιος χρησιμοποιεί το έργο σας που προστατεύεται από πνευματικά δικαιώματα χωρίς την άδειά σας, μπορείτε να ακολουθήσετε τη διαδικασία που περιγράφεται εδώ https://el.player.fm/legal.
Player FM - Εφαρμογή podcast
Πηγαίνετε εκτός σύνδεσης με την εφαρμογή Player FM !
Πηγαίνετε εκτός σύνδεσης με την εφαρμογή Player FM !
107. LLMをゼロから作るということ w/ Takahiro Omi
MP3•Αρχική οθόνη επεισοδίου
Manage episode 383875982 series 2451650
Το περιεχόμενο παρέχεται από το iwashi. Όλο το περιεχόμενο podcast, συμπεριλαμβανομένων των επεισοδίων, των γραφικών και των περιγραφών podcast, μεταφορτώνεται και παρέχεται απευθείας από τον iwashi ή τον συνεργάτη της πλατφόρμας podcast. Εάν πιστεύετε ότι κάποιος χρησιμοποιεί το έργο σας που προστατεύεται από πνευματικά δικαιώματα χωρίς την άδειά σας, μπορείτε να ακολουθήσετε τη διαδικασία που περιγράφεται εδώ https://el.player.fm/legal.
ストックマークの近江さんをゲストに、大規模言語モデルをゼロから作る方法、学習のデータセット、モデルアーキテクチャ、学習環境への取り組みなどについて語っていただきました。
話したネタ
- どのような大規模言語モデルと作ったのか?特徴は何か?
- データセットに何を使ったのか?
- 日本語と英語とのバランスは?
- 最終的なToken数は?
- 事前学習モデルを作りたいとして、何から考えるのか?
- ノイズのクリーニングと、その方法
- 今回活用したモデルアーキテクチャ(Llama)
- 前回のアーキテクチャは GPT-NeoX
- 今回の学習環境は?
- AWS Trainum 32コア x 16ノード
- 学習にかかった時間は?
- 学習時に大変だったこと・上手くいかなかったことは?
- 学習中のチェックポイントとは何か?
- なぜ、Token生成が速いのか?
- 手元でLLMを動かすときの一番のネックは?
- bit数を落とすFineTuning
- Tokenizerとは何か?
- 日本語の単語区切りはどのように考えるのか?
- 今回のLLM作成のTokenizerは何を使ったのか?
- ビジネスドメインでのLLM評価
- ストックマーク株式会社のRecruitページ
See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.
124 επεισόδια
MP3•Αρχική οθόνη επεισοδίου
Manage episode 383875982 series 2451650
Το περιεχόμενο παρέχεται από το iwashi. Όλο το περιεχόμενο podcast, συμπεριλαμβανομένων των επεισοδίων, των γραφικών και των περιγραφών podcast, μεταφορτώνεται και παρέχεται απευθείας από τον iwashi ή τον συνεργάτη της πλατφόρμας podcast. Εάν πιστεύετε ότι κάποιος χρησιμοποιεί το έργο σας που προστατεύεται από πνευματικά δικαιώματα χωρίς την άδειά σας, μπορείτε να ακολουθήσετε τη διαδικασία που περιγράφεται εδώ https://el.player.fm/legal.
ストックマークの近江さんをゲストに、大規模言語モデルをゼロから作る方法、学習のデータセット、モデルアーキテクチャ、学習環境への取り組みなどについて語っていただきました。
話したネタ
- どのような大規模言語モデルと作ったのか?特徴は何か?
- データセットに何を使ったのか?
- 日本語と英語とのバランスは?
- 最終的なToken数は?
- 事前学習モデルを作りたいとして、何から考えるのか?
- ノイズのクリーニングと、その方法
- 今回活用したモデルアーキテクチャ(Llama)
- 前回のアーキテクチャは GPT-NeoX
- 今回の学習環境は?
- AWS Trainum 32コア x 16ノード
- 学習にかかった時間は?
- 学習時に大変だったこと・上手くいかなかったことは?
- 学習中のチェックポイントとは何か?
- なぜ、Token生成が速いのか?
- 手元でLLMを動かすときの一番のネックは?
- bit数を落とすFineTuning
- Tokenizerとは何か?
- 日本語の単語区切りはどのように考えるのか?
- 今回のLLM作成のTokenizerは何を使ったのか?
- ビジネスドメインでのLLM評価
- ストックマーク株式会社のRecruitページ
See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.
124 επεισόδια
Toate episoadele
×Καλώς ήλθατε στο Player FM!
Το FM Player σαρώνει τον ιστό για podcasts υψηλής ποιότητας για να απολαύσετε αυτή τη στιγμή. Είναι η καλύτερη εφαρμογή podcast και λειτουργεί σε Android, iPhone και στον ιστό. Εγγραφή για συγχρονισμό συνδρομών σε όλες τις συσκευές.