ニュース

国産の日本語生成AIの無料デモ版が公開～「GPT-3.5 Turbo」に匹敵する性能を達成

東大初のELYZA社が700億パラメーターのLLM「ELYZA-japanese-Llama-2-70b」を開発

長谷川正太郎

2024年3月12日 16:57

「GPT-3.5 Turbo」に匹敵する性能を達成した国産の日本語生成AIの無料デモ版が公開

　大規模言語モデル（LLM）の社会実装を進める東京大学松尾研究室発の企業（株）ELYZAは3月12日、700億パラメーターの大規模言語モデル（LLM）「ELYZA-japanese-Llama-2-70b」を開発したことを発表した。また、「ELYZA-japanese-Llama-2-70b」を含む同社のLLM群を「ELYZA LLM for JP」シリーズとして提供を開始し、無料で使えるチャット形式のデモサイトを公開している。

「ELYZA-japanese-Llama-2-70b」のデモサイト

　「ELYZA-japanese-Llama-2-70b」は、同社が公開している日本語のベンチマーク「ELYZA Tasks 100」を使った人力のブラインドテストや、Stability AI社が提供しているベンチマーク「Japanese MT-Bench」の自動評価で、高いスコアを獲得。国産の日本語LLMで最高の性能を発揮したほか、「GPT-3.5 Turbo」シリーズや「Gemini 1.0 Pro」に匹敵する性能を達成している。

「ELYZA Tasks 100」によるグローバルモデルとの性能評価比較

「ELYZA Tasks 100」による国産モデルとの性能評価比較

　デモサイトではチャット形式でプロンプトに対する回答が得られる。あらかじめ、［情報整理（表形式）］、［対話要約］、［情報抽出］、［妹キャラ］ボタンが用意されており、クリックするとそれぞれの用途の例がプロンプトして入力される。入力されたプロンプトを編集すれば、自分の目的に沿った回答を得ることが可能だ。

［情報整理（表形式）］のプロンプト

プロンプトに対する回答

［対話要約］のプロンプト

プロンプトに対する回答

［情報抽出］のプロンプト

プロンプトに対する回答

［妹キャラ］のプロンプト

プロンプトに対する回答

　同社は、「ELYZA-japanese-Llama-2-70b」を皮切りに、今後も日本語においてグローバルプレイヤーが提供するLLMに匹敵する性能を持つ汎用LLMの開発・改善を進めていくとしている。汎用モデルのほか、業界・企業などに特化したLLMの開発も開始し、これらを「ELYZA LLM for JP」シリーズとしてさまざまな形態で提供するとのこと。