◀ AIニュースまとめ(2026.06.11–06.19)に戻る
NTT の国産AIモデル tsuzumi 2 の開発者が、AIコーディング(プログラム作成)がこの5年で進化した理由を分析しています。鍵になったのは、学習データの規模と質、そして専用エージェントの登場だそうです。
tsuzumi 2 とは
tsuzumi(つづみ)2 は、NTT が約3年かけて開発した 国産の大規模言語モデル(LLM) です。日本語に特化 していて、コーディング能力にも力を入れているところが特徴で、GPU 1枚でも動く 軽さを売りにしています。海外の巨大モデルが大量の計算資源を前提にするなかで、限られた設備でも動かせる現実的な国産モデルとして位置づけられています。今回の記事は、その開発者が、なぜAIコーディングはここまで急に進化したのかを解説したものです。
なぜ5年で急進化したのか
開発者は、AIコーディングの進化を大きく3段階で整理しています。まず 2020〜21年 の GPT-3 などで土台になる言語モデルができて、次に InstructGPT(ChatGPT の前身)で 人間の指示どおりに動く ようになって、2024年ごろ からはデータの品質を高める工夫で段階的に賢くなった、という流れです。とりわけ大きかったのが 学習データの拡大と質の向上 で、GitHub 由来の Python コードは 159GB から32.1TB(約200倍) にまで増えて、不要なデータを取り除くフィルタリングの精度も上がりました。その結果、コーディング能力の指標である HumanEval の正解率は 28.8%から65% へと大きく伸びました。さらに Claude Code のような コーディング専用のAIエージェント が登場して、実際の開発現場で使える水準に到達しました。
用語ミニ解説
- LLM(大規模言語モデル):大量の文章を学習して、文章の生成や質問への回答ができるAIです。ChatGPT や Gemini、tsuzumi もこの仲間です。
- HumanEval:AIのプログラム作成能力を測る代表的なテストです。出された課題を正しく解けたかどうかで正解率を出します。
- AIエージェント:指示にもとづいて、人の代わりに一連の作業(調査やコード作成、実行)を自分で進めるAIのことです。
コメント