【大規模言語モデル(LLM)】ゼロから作るDeep Learning 3の評価