ニュース
「Llama 3.1」ベースの日本語追加学習LLM、サイバーエージェントが爆速公開
ベースモデルの発表よりわずか約2日でのスピード対応
2024年7月29日 10:24
(株)サイバーエージェントは7月26日、米Metaが開発したオープンLLM「Llama 3.1 70B」をベースに、日本語データで追加学習を行なったLLM「Llama-3.1-70B-Japanese-Instruct-2407」を公開した。同モデルは「Hugging Face」にて公開されており、Meta独自の「Llama 3.1 Community License」のもと、基本的に商用利用可能。ただし、利用規約への同意や追加ライセンスが必要な場合もある。
【モデル公開のお知らせ】
— サイバーエージェント 広報&IR (@CyberAgent_PR)July 26, 2024
Llama 3.1 70Bをベースに日本語データで追加学習を行ったLLMを公開しました。 今後もモデル公開や産学連携を通じて国内の自然言語処理技術の発展に貢献してまいります。
https://t.co/Kbo27kSSAK
8B/70B/405Bのモデルからなる「Llama 3.1」シリーズは、現地時間7月23日に発表・公開されたばかりの最新LLM(オープンモデル)。150を超える複数のベンチマークにおいて、米OpenAIの「GPT-4o」や米Anthropicの「Claude 3.5 Sonnet」といった他社モデル(クローズドモデル)よりも優れたパフォーマンスを発揮できたとされている。
対応言語については、公式アナウンス的には英語を含む8言語にサポートを拡張したが、その中に日本語は含まれていなかった。
今回の「Llama-3.1-70B-Japanese-Instruct-2407」は、サイバーエージェントが「Llama 3.1 70B」をベースに日本語データで追加学習を行なったモデルとなる。ベースモデルの発表より約2日以内という、まさに“爆速”なスピード感のある対応は驚異的であり、「Llama 3.1」の日本語サポート体制を補うものとして期待される。
同社は、今回のモデル公開に際し、「今後もモデル公開や産学連携を通じて国内の自然言語処理技術の発展に貢献してまいります」とコメントしている。