柳谷智宣のAI ウォッチ!
IQは人間超え! ChatGPTの最強推論モデル「o3」の実力を体感するためのつかいかた
推論モデルの「強み」と「弱み」を知る[前編]
2025年5月7日 09:00
2025年4月16日、ChatGPTに「o3」モデルの提供が開始された。従来の「GPT」シリーズとは異なるアーキテクチャを採用し、複雑な問題解決能力とマルチモーダル処理に特化しているのが特徴。汎用人工知能(AGI)に向けた画期的な推論モデルとして注目を集めている。
問題を細分化して段階的に解決する思考プロセスをシミュレートする「o3」は、博士課程レベルの科学問題で87.7%の正答率を達成、ARC-AGIベンチマークでは人間平均を超える87.5%を記録した。また、Mensa Norwayテストにおいて、o3はIQ 136をたたき出しており、ほとんどの人間のIQを超えていると言われている。
ChatGPT Proユーザーの筆者はo3を使い倒しているが、o1と比べて明らかに賢くなっていると感じる。長文の一発出力では「o1 Pro mode」の方が優れているものの、o3の万能っぷりには日々驚かされている。
Proプランではo3を無制限に使えるが、それ以外のユーザーは利用回数が制限されており、50件/週となっている。そのため、あまり使い込めずに実力がわからない、という人も多いだろう。そこで、今回は「o3」の実力を体感するための活用術5選を紹介する。
活用術1:ファイル分析
o3のマルチモーダル性能はさらに向上しており、より複雑な画像内の詳細を理解し、分析できるようになった。画像から論理的な推論を行う能力が強化され、視覚情報から結論を導き出すことができるのだ。
また、o3は画像と言語を深く統合して理解し、画像についての詳細な質問に回答したり、視覚情報を言語に変換したりする能力も向上している。
試しに、旅行先で撮影した写真をアップロードして「ここはどこ?」と聞いてみよう。有名な観光スポットであれば一撃で回答してくれるのはもちろん、人間の目では手がかりがないような写真でも回答してくれることがあり、驚くこと請け合いだ。
まずはウイスキーの熟成庫の写真をアップ。もちろん、看板や商品名などがない写真を選んだつもりが、簡単に当てられてしまった。
次に、夜景の写真をアップしても一発正解。そこで、どこから撮影したのかを聞いてみると、撮影場所を推理してこちらも正解した。
筆者が重宝している「o1 Pro mode」は画像しかアップロードできないのがネック。o1 Proではファイル分析ができなかったのだが、o3は大得意。例えば、飲食店の売上表を渡し、インサイトをグラフ化してもらうなども簡単だ。
ちなみに、ファイルを作成してもらうこともできる。どんな表を作りたいのかを具体的に記述すれば、o3が利用する関数も判断してExcelファイルを作成してくれる。
例を挙げると、KPIスコアや出勤率から総合スコアを加重平均で出し、順位付けして、ボーナスの有無を判定させる表などがプロンプトから作成できる。指示が不足していても、o3なら意図を汲み取って対応してくれるのが凄い。
Excelファイルを作成してください。1行目を太字・中央揃えにし、列幅を内容に合わせて調整しながら、左から順に「社員ID」「氏名」「部署」「KPIスコア」「行動評価スコア」「出勤率 (%」「総合スコア」「順位」「ボーナス推薦」という見出しを入力します。
総合スコアは、KPIスコアを60%、行動評価スコアを30%、出勤率を10%の重みで合計し、小数第1位で四捨五入してください。順位は、総合スコアを高い順に並べたうえで自動的に順位付けを行ってください。ボーナス推薦は、総合スコアが85以上の場合に「Yes」を表示し、それ以外は空欄にしてください。これらの計算・判定には、適切なExcel関数をChatGPTが自動で選定・設定するようにしてください。
次に、社員IDをE001~E010で連番入力し、日本人名をランダムに割り当て、4~5種類の部署へ分散配置します。KPIスコアと行動評価スコアには60~100の整数を、出勤率 (%) には90.0~100.0の1桁小数をランダム生成して入力してください。最後にファイルを「HR_Evaluation_Sample.xlsx」として保存し、ダウンロードできるようにしてください。
活用術2:検索
検索機能は元からついているが、精度が向上している。前回取り上げた「Deep Reasearch」機能も高精度だが、なにせ処理に時間がかかる。サクッと検索して処理して欲しいときは、o3に任せると便利だ。
例えば、SNS用の投稿文も内容と文字数を指定すれば、想定通りの文章を作ってくれる。140字と指定すると、本当に140文字ぴったりで作成してくれるのが賢い。あとは投稿するだけでよいので手間が省ける。
様々なネット詐欺の事例や被害を検索し、手口と対策を簡単に紹介し、「詳しくはこちら! https://example.com/」という文言で終わるSNS投稿用文章を10パターン作成してください。すべて異なるネット詐欺に関する内容にしてください。シニア向けの文章で、ですます調。文章全体で文字数は140文字にしてください。
1:恋人を装うロマンス詐欺が急増。甘い言葉で投資を勧め、多額送金を迫ります。被害者の平均損失は300万円超。写真やビデオ通話で本人確認を行い、第三者に相談して被害を防ぎましょう。一人で判断しないで家族に相談が安全。必ず確認を!詳しくはこちら! https://example.com/
2:店頭のQRコードを貼り替える詐欺が発生。スマホで読み込むだけで攻撃者口座へ入金されます。支払前に表示名と店員確認を徹底。決済履歴をこまめにチェックし、不審があれば即通報で被害軽減。一瞬の油断が大損!高齢者の被害が拡大中。!詳しくはこちら! https://example.com/
~略
活用術3:画像生成
イメージ生成機能も凄い。テキストで指示してさまざまな画像を生成できるし、写真をアップロードして「●●風」とするのも流行っている。ビジネスシーンで活用するなら、o3の分析能力と組み合わせてみよう。
例を挙げれば、4月に公開された経済産業政策局の「経済産業政策新機軸部会 第4次中間整理 概要」を理解するために、PDFファイルをo3にアップロード。「横長のグラレコ風イラストにわかりやすくまとめて」と入力してみよう。日本語のフォントが少し微妙なところもあるが、一目で内容を理解できる画像が生成されるのには驚くはずだ。
これまでは難しかった図解もできるようになっている。
例えば、執筆した原稿のパラグラフをアップロードして「この部分の図解を作って」と指示するだけで、文字が入った図の画像が生成される。ニーズに合わせて「ニュートンの人物イラストを入れて、ミニマルデザインで、モノクロで」といった指示を追加すればよい。
以下の原稿の横長の解説図解を作成してください。
###原稿
~万有引力の説明
活用術4:推論能力
o3は普通のタスクも賢く処理してくれるが、やはり推論させるとクオリティの高さを実感できる。これは、皆さんが興味を持っていたり、詳しかったりする領域について生成させてみるとよいだろう。内容をわかる分、その真髄が理解できるはずだ。
最近、これからの子供たちが求められる価値観やスキルはどう変化するのだろう、と考えることが多かったので、試しにo3に推論してもらった。
指示通りに、今後10年の社会変化について予測した上で、求められる価値観やスキルをリストアップし、さらには日常での育み方まで生成してくれた。プロンプトから「子供に身に付けさせたいのだろう」と意図を汲んでくれたのだ。
そして、その内容にも納得。例えば、AIは“確率的最適解”なので、1つの答えに飛びつくと誤導されるため、多面的リアリティ感覚が求められる。日常では、1つの問いに複数の検索エンジンとGPTを併用し、自分で突き合わせて仮説を立てる習慣をつくるべきだという。このような内容が8個提示されており、これだけで8章立ての単行本が書けそうだ。
近年、AIが急激に進化していますが、今後10年間で社会にどんな変化が起きるか具体的に予測してください。そして、今生まれた子供たちが幸せに生きていくには、どんな価値観やスキルを持つべきなのかも考えてください。一般論に終始せず、人間に忖度しなくていいので、とことん考えて具体的に教えてください。
コア価値観 なぜ重要か 日常での育み方
多面的リアリティ感覚 AI は“確率的最適解”。1 つの答えに飛びつくと誤導される。 1 つの問いに複数の検索エンジンと GPT を併用し、自分で突き合わせて仮説を立てる習慣をつくる。
~略
活用術5:アニメーション生成
国のGDPや企業の売上高のランキングを表した棒グラフが、年を経るごとに変化するショート動画を見かけることがある。面白くてついつい見てしまうが、作り方はさっぱりわからなかった。
しかし、それもo3に頼めば作ってくれる。Excelファイルで元となる情報を渡して「棒グラフが動くアニメーションを作って」と指示すればよいのだ。実際に、動くアニメGIFが生成できたのは感動だ。
ただし、年数や企業を増やすと、メモリオーバーで処理が止まってしまうこともあった。できることはわかったので、あとはリソースの問題だ。さらなる性能向上に期待したい。
企業の売上高のトップ5の棒グラフが、年を追うごとに順位が入れ替わっていくアニメーションを生成してください。金額はトップが100%になるように動的に調整し、企業ごとに異なる色を設定してください。直近10年分で10秒にまとめ、順位が変わる際は、ゆっくりとスムーズに棒が移動するアニメーションGIFにしてください。
なお、今回の記事を書くにあたり、生年月日や手のひらの画像を渡して「占ってもらう」というテストをしたところ、とても興味深い結果が得られた。昔占ってもらった結果にも似ていたのだが、筆者では結果を精査できない。そこで、知人の占い師に意見を聞いたところ、「間違いだらけ」とのことだったので、今回は取り上げないことにしたい。
生成AIはその仕組み上、学習したデータが間違っていれば当然出力も間違える。正確なデータをもとに学習しても、ハルシネーションが起きる可能性もある。たとえ、凄まじい性能を持つ「o3」だとしても、AIの出力を鵜吞みにせず、自分でチェックすることを怠らないようにしよう。
以上が、OpenAI最新の推論モデル「o3」の実力を体感するための活用術5選となる。
o3の賢さは一度使うと手放せなくなるほど。1日7回では足りないと感じるはずだ。タスクによって「o4-mini」などと使い分ければよいのだが、それも手間がかかる。もし、ビジネスでChatGPTを使うのであれば、ここはProプランをお勧めしたい。たしかに高額だが、コスパで考えれば十分に元が取れることだろう。
著者プロフィール:柳谷 智宣
IT・ビジネス関連のライター。キャリアは26年目で、デジタルガジェットからWebサービス、コンシューマー製品からエンタープライズ製品まで幅広く手掛ける。近年はAI、SaaS、DX領域に注力している。日々、大量の原稿を執筆しており、生成AIがないと仕事をさばけない状態になっている。
・著者Webサイト:https://prof.yanagiya.biz/