生成AI

大規模言語モデル入門 = Introduction to Large Language Models

0.05 / 5

Featured in Qiita

Information

内容	ChatGPTに代表される大規模言語モデルが自然言語処理の幅広いタスクで高い性能を獲得し、大きな話題となっています。大規模言語モデルは、大規模なテキストデータで訓練された大規模なパラメータで構成されるニューラルネットワークです。2020年以降、自然言語処理や機械学習の知見をもとに、パラメータ数とテキストデータの拡大により、性能が飛躍的に向上しました。 Hugging Face社の"transformers"というPythonライブラリを利用することで、プログラミングの経験があれば、モデルの操作やデータからの学習がかんたんにできます。モデルを訓練するための日本語もしくは日本語を含む多言語のデータセットも充実してきており、すぐに業務に使える実用的なモデルを作ることが可能な時代がやってきました。本書は、大規模言語モデルの理論と実装の両方を解説した入門書です。大規模言語モデルの技術や自然言語処理の課題について理解し、実際の問題に対処できるようになることを目指しています。以下のような構成によって、理論とプログラミングの双方の側面から、大規模言語モデルに関する情報を提供します。第1章　はじめに第2章　Transformer 第3章　大規模言語モデルの基礎第4章　大規模言語モデルの進展第5章　大規模言語モデルのファインチューニング第6章　固有表現認識第7章　要約生成第8章　文埋め込み第9章　質問応答システム
著者	山田,育矢鈴木,正敏ソフトウェアエンジニア山田,康輔李,凌寒
出版日	202308
出版社	技術評論社
ISBN-13	9784297136338
データ提供元	openBD, 楽天

楽天の商品情報

価格	3,520 詳細はこちら

【生成AI】大規模言語モデル入門 = Introduction to Large Language Modelsの評価