ニュース
Meta「Llama 3.1」発表、無料&商用可能なオープンLLMで「GPT-4o」を凌駕
405Bモデルを導入、コンテキストウィンドウは128Kに
2024年7月24日 10:39
米Metaは7月23日(現地時間)、“オープンソース”の大規模言語モデル「Llama 3.1」を発表した。ラインナップに405Bモデルを導入し、最新リリースに合わせて「Llama 3」の8Bモデルと70Bモデルにもアップグレードが実施される。各モデルウェイトは公式サイトおよび「Hugging Face」より無料でダウンロード可能。
「Llama 3.1」は、Metaが研究を進めている商用利用可能な大規模言語モデル(LLM)「Llama」の最新版。今回の新モデルでは、コンテキストウィンドウが128Kに、多言語サポートも拡張されている。
同社によると、150を超える複数のベンチマークにおいて「Llama 3.1」は、米OpenAIの「GPT-4o」や米Anthropicの「Claude 3.5 Sonnet」といった他社モデル(クローズドモデル)と競合できることが示されたとしている。
「Llama 3.1」は、長文テキストの要約、多言語会話エージェント、コーディングアシスタントといった高度なユースケースをサポート。ライセンスを変更し、開発者が「Llama」モデル(405Bを含む)の出力を使用して他モデルを改善できるようにした。また、「Llama Guard 3」(入力出力調整)と「Prompt Guard」(悪意のあるプロンプト攻撃から保護)といったセキュリティツールでリファレンスシステムを強化し、モデル層を超えて責任のあるAI開発を支援する。
トレーニングデータは15兆を超えるトークン規模で行なわれ、使用された米NVIDIAのGPU「H100」は16,000個以上にもなるという。
最新モデルは、AWS、Databricks、Dell、NVIDIA NIM、Groq、IBM WatsonX、Google Cloud、Microsoft Azure、Scale AI、Snowflakeといった主要なクラウドサービスで利用できる。発表初日よりサービスが提供開始されており、Metaによると、「GPT-4o」などのクローズドモデルを使用する場合よりも、コストを50%カットできるとしている。
なお、「Llama 3.1」は“オープンソース”モデルと謳われているが、「llama.meta.com」および「Hugging Face」からダウンロードする際には、氏名や生年月日といった個人情報の入力、コミュニティライセンスと利用規約の同意が必要となっている。