大規模言語モデル(LLM)の世界は、私たちのコミュニケーションや情報処理の方法を革新しています。この「大規模言語モデル入門Ⅱ」では、生成型LLMの実装と評価について深く掘り下げています。特にLangChainというフレームワークを使用することで、初学者でも簡単にトランスフォーマーベースのモデルを活用し、自分のプロジェクトに組み込むことが可能です。 この書籍では、基本的な概念から始まり、実践的なコード例を通じて、実際にどのようにLLMを構築し、評価するかを学べます。LangChainの力を活かすことで、データの処理、APIとの連携、さらにはインタラクティブなアプリケーションを迅速に開発することができます。 特に、自分のアイデアを具現化するための実践的なステップや、モデル評価の観点からの考察が充実しており、自信を持ってプロジェクトを進めるための手助けとなります。生成型LLMの魅力を再発見し、自分のスキルを新たな次元へと引き上げましょう。あなたの手で次世代のアプリケーションを作り上げる第一歩を、この書籍から始めてみませんか?
内容 | 「大規模言語モデル入門」の続編です。「大規模言語モデル入門」は理論と実装のバランスをとって構成しましたが、本書では実装部分で扱い切れなかった話題を取り上げ、特に大規模言語モデルの評価と生成LLMに関連する解説を充実させます。「大規模言語モデル入門」の9章に続き、10章から始まります。 10章では、後続する章で行う言語モデルの評価方法について解説します。自動評価と人手評価の2つの側面から、ベンチマーク、評価指標、具体的な評価ツールやデータセットなどを取り上げます。11から13章では、主に大規模言語モデルの性能を上げるためのトピックとして、指示チューニング、人間のフィードバックからの学習、RAGに焦点を当て、それぞれの実装方法、利用するデータセット、評価の方法について解説します。14章では大規模言語モデルの学習における並列・分散処理について詳しく解説します。大規模なデータを限られた計算資源で学習させるノウハウは多くのエンジニアにとって有益な情報となるでしょう。 大規模言語モデルの性能を高めるための各トピックの実装とともに、それぞれの評価について理解できる一冊です。 |
---|---|
著者 | 山田育矢 鈴木正敏 西川荘介 藤井一喜 山田康輔 李凌寒 |
出版社 | 技術評論社 |
ISBN-13 | 9784297143930 |
データ提供元 | openBD, 楽天 |
価格 | 3,300 詳細はこちら |
---|