レビュー

噂の「GPT-4o」の応答速度をガチ測定してみた、どこが特に速くなったのか?

最新ChatGPTモデル「GPT-4o」

 米OpenAIが5月13日(米国時間)に発表した最新ChatGPTモデルである「GPT-4o」はマルチモーダルで、音声、画像、テキストを入力できるようになり、「人間のようにリアルタイムの会話ができるようになった!」と話題となっています。たしかに、すごい進化ですよね。

 しかし、評判になっている人間的な応答は、インターフェイスであるアプリケーションがそうなるよう作っているのであって、今回のアップデートの本質は、GPT-4oのレスポンス速度の向上にあるのでは? つまり単純に反応速度が早いから今までできなかったことが可能となったのでは? との見方もできます。

 そこで、GPT-4oと、その登場以前まで最強だった「GPT-4 Turbo」を、純粋な応答速度で比較してみることにしました。OpenAIが提供するAPIをコールし、そのレスポンスが返ってくるまでの速度をミリ秒単位で計測してみました。

 今回の検証はExcelマクロで簡単に連続処理ができるよう、以下の拙書で解説している「ChatGPT関数」を使用しています。

 検証は実務に合わせた次の4パターンで行ってみました。

Noパターン検証内容
単純な会話(15文字)「こんにちは、あなたは誰ですか?」と質問する
短文の要約(2,500文字)「次の文章を要約してください」として2,500文字の文章を要約させる
長文の要約(10,000文字)「次の文章を要約してください」として10,000文字の文章を要約させる
画像認識(解析)カスタマイズしたOfficeのリボン画像を解説させる

 ③の長文の要約は、上記書籍の「3章 VBAで会話する(ChatGPT)」の前半部分を丸々、②は、その一部を使っています。画像認識(解析)は、同じく書籍で作成しているアドインから、次の生成AIカスタムリボンのキャプチャを使用しました。

画像解析で使った画像。各モデルの解析内容にも注目したいところ

 レスポンスの速度は、リクエストごとにバラツキがあるため、計測は1パターンにつき20回行って平均値を取りました。さあ、GPT-4oの、実力やいかに?

パターン① 単純な会話(15文字)GPT-4oの応答速度はおよそ4倍、「GPT-3.5 Turbo」も上回る

 まず、パターン① 単純な会話(15文字)です。

「こんにちは、あなたは誰ですか?」という単純な会話への応答速度比較

 GPT-4oの応答速度が劇的に向上していることがわかります。およそ4倍程度に高速化、一世代前の「GPT-3.5 Turbo」も上回っています。さすがはGPT-4oといったところでしょうか。

パターン② 短文の要約(2,500文字)GPT-4 Turboの2倍程度に高速化

 次に、パターン② 短文の要約(2,500文字)です。

2,500文字程度の要約をしたときの応答速度比較

 こちらは、パターン① 単純な会話ほど応答速度に顕著な差が見られませんでしたが、GPT-4oはGPT-4 Turboの2倍程度の速度となっています。GPT-3.5 Turboの健闘ぶりも素晴らしく、精度を求めない要約であれば3.5で十分かもしれません。

パターン③ 長文の要約(10,000文字)

 さらに、パターン③ 長文の要約(10,000文字)を見ていきましょう。

10,000文字程度の要約をしたときの応答速度比較

 短文の要約(2,500文字)と比べて、明らかに速度向上が鈍化しています。GPT-4oといえど、難解な質問や長文の処理に関しては、劇的な速度向上は見込めない、と言えそうです。

パターン④ 画像認識(解析)速度は3倍、認識精度も大きく向上

 最後にパターン④ 画像認識(解析)です。

画像解析の応答速度比較。GPT-3.5を除いて比較

 GPT-3.5 Turboには画像認識の機能はないため、GPT-4同士の比較となりますが、こちらは、なんと3倍程度の速度向上となっており、画像解析の使い勝手が大幅に向上しそうです。

 さらには、解析結果に関しても次のような違いがあり、認識精度も向上しているように感じます。

GPT-4 Turboの解析結果

表示されているのは、Microsoft Excelの画面の一部です。これはリボンインターフェースの「OpenAI」タブを示しており、Excel内でOpenAIの機能を使うことを想定したカスタムタブのように見えます。このタブには、「ChatGPT」「DALL-E」「GPT-4V」というボタンがあります。これらは、OpenAIの人工知能製品を指し、Excel内でこれらのAIモデルを利用する機能が提供されていることを示唆しています。ただし、これらの機能が実際に利用可能であるか、またはデモンストレーションやモックアップであるかは、この画像だけからは判断できません。

GPT-4oの解析結果

これは、Microsoft Excelの拡張機能タブに表示されている「OpenAI」の統合機能のスクリーンショットです。このタブには以下のOpenAI機能が含まれています:

  1. **会話する(ChatGPT)** - ChatGPTと会話するための機能。
  2. **数式解説** - 数式の説明機能。
  3. **モデル設定** - モデルの設定機能。
  4. **画像生成(DALL-E)** - DALL-Eにより画像を生成する機能。
  5. **画像解析(GPT-4V)** - GPT-4Vにより画像を解析する機能。

これらの機能は、OpenAIの各種モデルを利用してExcel内で高度な自然言語処理や画像生成・解析などを行うためのツールです。

GPT-4oは、短い会話なら「公式発表」よりも高速?

 今回、検証で取得したレスポンスデータは次の通りです。

各パターンの検証を表にまとめた。20回の検証から平均を割り出している

 上表は、厳密にはChatGPTの応答速度に加えてJsonのエスケープ処理などの時間も含んでいますが、それらを計測したところ、ミリ秒単位、長くても0.03秒程度だったので、リクエストの処理時間として、そのまま使用しています。

 OpenAIのアナウンスでは、GPT-4oはGPT-4 Turboの2倍速い(2x faster latency. GPT-4o is 2x faster than GPT-4 Turbo.)とのことでしたが、短い会話においてはそれ以上の速度向上がありました。公式動画の自然な会話応答も、このレスポンス速度があって実現したのでしょう。

Say hello to GPT-4o

 今回の検証で2倍程度の速度向上にとどまった短文要約も、そこそこ長い2,500文字をプロンプトに投入していますので、通常の質問や会話においては、公式アナウンス以上に軽快なレスポンスとなると考えてよいかもしれません。

書籍版コードを「GPT-4o」に対応させる方法

 なお、前述の書籍で紹介しているアドインで、最新モデルを使用する場合は、次のように「モデル設定」を行うSetGPTmodelプロシージャのモデル名を変更します。これだけで最新のGPT-4oモデルが使えるようになるのです。

赤で囲んだ部分にGPT-4oのモデル名を追記している
書籍ではダイアログボックスを表示してGPTのモデルを選択できるようになっている

 書籍を読んでくださった読者の方は、ぜひ、コードを修正して最新の「GPT-4o」をOfficeアプリから使用することをお勧めします!