ニュース

「生成AIツール for Excel」がGoogleの生成AI「Gemini 1.5 Pro」に対応

生成AI主要6モデルをSPI型テストを用いて業務適正を比較した結果も発表

「生成AIツール for Excel」

 (株)ビジー・ビーは5月10日、「Microsoft Excel」用のアドイン「生成AIツール for Excel」を2024年5月版へアップデートしたと発表した。今回のアップデートではGoogleの生成AI「Gemini 1.5 Pro」に対応した。

  「生成AIツール for Excel」は、米OpenAIの「ChatGPT」やAnthropicの「Claude 3」といった生成AIを「Excel」の関数として利用できるようにしたアドイン。5月版で「Gemini 1.5 Pro」が選択可能となったことにより、生成AIの主要3社16モデル(「GPT-4 Turbo」、「Gemini 1.5 Pro」、「Claude 3 Opus」など)に対応するExcelアドインとして世界で唯一となった。

 「生成AIツール for Excel」は、Windows/Mac版の「Excel 2016」以降に対応しており、現在「ppsource.microsoft.com」から無料でインストール可能。ただし、利用の際はOpenAIやGoogleから取得したAPIキー(秘密鍵)が必要で、APIの利用には別途費用が発生することがある。

生成AIにSPIを解かせると、「就活生並み」の実力

 「生成AIツール for Excel」の最新版公開に伴い、ビジー・ビーは生成AIの主要6モデル「GPT-4」「GPT 3.5 Turbo」「Claude 3 Opus」「Claude 3 Sonnet」「Gemini 1.5 Pro」「Gemini 1.0 Pro」について、採用試験などで使用されるSPI型テストを用いて業務適正を比較した結果を明らかにしている。

採用試験で使われるSPI型で業務適性を比較
正答数の比較

 正答数だけでいえば、「Claude 3 Opus」が295問中173問正解でトップ、グーグルの 「Gemini 1.5 Pro」の正解数は162、「GPT-4」は158という結果になった。「世界最高性能」と評されることが多いOpenAIの「GPT-4」は、SPIの得点では最高性能ではなく、日本国内では知名度が低い「Claude 3 Opus」が最高性能であることがわかった。「Claude 3 Opus」の正答率は59%で、同社は来春卒業見込みの就活生並みの実力と評している。

 分野別にみると、英語分野の正答率は、「GPT-4」が100%、「Claude 3 Opus」が98%、「Gemini 1.5 Pro」が92%という結果になった。言語(日本語)分野の正答率では、「Claude 3 Opus」が62%、「GPT-4」が55%、「Gemini 1.5 Pro」が52%という結果に。そして、非言語(計算、論理)分野の正答率は、「Claude 3 Opus」が46%、「Gemini 1.5 Pro」が45%、GPT-4が40%で、いずれも5割を超えるモデルはなかった。

 この結果を踏まえ、同社ではAIモデルにも得意分野があるとした上で、適切なプロンプトエンジニアリングと各モデルの得意分野を組み合わせた場合、SPI型テストの正答率は82%に達することから、「優良企業に就職できる程度に優秀」と評価している。