柳谷智宣のAI ウォッチ!

高性能な生成AIは一般ユーザーでも使いこなせるのか ~推論に強いAIと応答速度の速いAI、二刀流のすすめ

ChatGPTの最上位プランから「将来」を考える[後編]

 本連載「柳谷智宣のAI ウォッチ!」では、いま話題のAI(生成AI)を活用したサービスを中心に取り上げていく。基本的に、前編ではまねるだけですぐに試せる「つかいかた」を解説、後編では同種のサービスも例にビジネスシーンでの活用方法や「AIトレンド」に迫っていく予定。今回は、高性能な生成AIの活用法を取り上げる。
用途ごとにパワータイプとスピードタイプのAIを使いこなす二刀流が重要になる

 ChatGPT o1 pro modeの実力は前編で紹介した通り、驚くべきものだ。逆に、普通の原稿執筆程度では真価を発揮できていないかもしれない。それほどの性能が実はまだまだ発展途上だし、何なら数カ月以内に大幅に高性能なモデルの登場が予定されている。

 AIの進化振りは目まぐるしすぎるが、知らんぷりもできない。今回は、高性能な生成AIをどう活用していくのか考えてみよう。

無料なのにo1 pro mode並みの性能を備える「Gemini 2.0 Flash Thinking」はどうか

 OpenAIが12月に行った「12 Days of OpenAI」では「ChatGPT Pro」や「Sora」などが注目を集めていたが、実はGoogleもそこにぶつけるように新機能をリリースしまくっていた。

 そんな中、12月19日にGoogleは推論型のAIモデル「Gemini 2.0 Flash Thinking」をリリースした。こちらも「o1 pro mode」並みの性能を備えており、注目を集めている。Googleの生成AIプラットフォーム「Google AI Studio」で利用できる。

 まずは、さっと「ChatGPT 4o」が回答できない「“dismiss”の中には“s”はいくつある?」や「10.11と10.9では、どちらが大きい?」といった問題を出してみた。

 Geminiの場合、この二つは正解したのだが、「ある人が風邪にかかりました。次にかかったのは何でしょうか」は不正解。とはいえ、思考プロセスを見ると、病気以外のことを指しており、ジョークを期待していると予測。しかし、最終的に「二度目の風邪」と回答した。不正解だったものの、一度はジョークと判断して「かかり」可能性のあるものを探ったというのは凄いことだと思う。

単語の中を細かく分析したり、小数点以下を比較することはできた
日本語ジョークは不正解だが、思考プロセスはあっていた

 次は、前編でも使ったブログ記事の作成にチャレンジ。

 o1 proは10分以上かかったが、「Gemini 2.0 Flash Thinking」は軽量モデルなのですぐに表示してくれるのが凄い。文字数は3,548文字と問題なしで、内容もまとも。ただし、文体を守らない上にカジュアルすぎる、パラグラフを切らずに長すぎる、というところがマイナスポイント。おそらく「軽快な文章で、読みやすさを心掛けてください」という指示を重視したのだろう。

 とはいえ、「だである調になってませんよ。あと、パラグラフが長すぎです。適当に改行してください」と追加指示したところ、13秒で対応してくれたので、修正するのにも手間はかからない。

・プロンプト
「DXの一歩はビジネスチャットの導入から」と言うテーマで詳細な原稿を書いてください。

あなたはプロフェッショナルのライターです。
軽快な文章で、読みやすさを心掛けてください。
想定読者は日本企業で働く30代の会社員です。
内容は具体的に明確にして、読者の学びになるようにしてください。
文体は「だ・である」調です。とはいえ、「である」は禁止です。
自然な日本語で、人間らしい文章を書いてください。
指示語はなるべく使わず、文末の語尾ダブりも回避してください。
箇条書きは禁止で、複数のパラグラフで執筆してください。
パラグラフは数文で、話題が変わったら、次のパラグラフにしてください。
4個のサブトピックを追加してください。
サブトピックにはイントロの内容は重複させないでください。
サブトピックの文字数は800文字以上です。文字数表記は不要です。
特に重要なところの1~2か所に、ここ授業に出るので覚えておくように!、という決め台詞を入れてください。
・出力
DX、始めませんか? 最初の一歩は、意外と身近なビジネスチャット

「DX、うちの会社もそろそろ取り組まないと…」そう思っている30代の会社員の皆さん、こんにちは。日々の業務に追われ、なかなか腰が上がらない気持ち、よく分かる。でも実は、DXってなんだか大掛かりなシステム導入だけじゃないんだ。もっと身近なところから始められるんだよ。今回は、DX推進の最初の一歩として、ビジネスチャットの導入について考えていこう。

皆さんの会社では、日々のコミュニケーションはどうされているかな? メールでのやり取りが中心だろうか。電話での連絡も多いかもしれないね。もちろん、これらのツールは今でも重要だが、情報伝達のスピード感や、ちょっとした相談のしやすさという点では、少し物足りなさを感じている方もいるんじゃないかな。ビジネスチャットは、これらの課題を解決し、よりスムーズで効率的なコミュニケーションを実現してくれる、まさに現代の働き方にフィットしたツールだ。

~略

 たしかに凄い性能だ。この応答速度の速さと現時点で無料というコストのメリットは大きい。

 ただし、性能比較であれば、o1 proの方がよさそう。そもそも、Gemini flashは軽量モデルなので、今後高性能なGemini 2.0 ProやGemini 2.0 Ultraが出るかもしれない。そうなれば、当然思考時間はさらに伸びるはずだ。

 今後は、以前から想定されていた「AIの使い分け」が進むと思われる。従来は、最新モデルでもそこそこ応答が早かったし、使い放題サービスを契約しているのであれば、どんなプロンプトでも入力してしまっていたと思う。しかし、「翻訳して」とか「本文を書いて」といったシンプルな処理であれば、軽量でコスパのよいAIを使う方が適している。下調べや構成などを軽量AIで調べ、がつんと推論してもらったり、原稿を書いてもらう時に最高性能のAIに指示を投げる。そして、待ち時間は他の作業を進める、といったフローが効率的だ。

一般的なビジネスシーンでも高性能な生成AIの恩恵を受けられる

 2024年10月、ソフトバンク最大規模の法人向けイベント「SoftBank World 2024」にて孫正義社長の特別講演が行われた。その中で、これまでのAIは応答速度競争になっていたが、ChatGPT o1は数十秒待たされることに言及していた。

 「(ChatGPT o1を)毎日のように使っているのですけど、できるだけ深く真剣に考えさせようと思って、難しい設問を投げかけました。そしたら、なんと75秒かかったんです。悩んでるな、という感じで、それを見ること自体がもう楽しいんですね。待たされることの喜びが出てきてしまった」と孫正義氏。人間並みに賢いAIがフル回転しているのを見て、楽しいというほどAIが好きなのは流石だ。彼ほどの人物がビジネスにChatGPTを活かしているのだから、「ChatGPTはまだ使い物にならない」なんてナンセンス。すぐ使い始めてほしい。

「o1の出力を待つのが楽しい」と語る孫正義氏(画像はYouTubeのソフトバンク公式 ビジネスチャンネルより)

 Gemini 2.0 Flash Thinkingやo1 Proは、複雑な問題解決や論理的推論を支援するために設計されており、医療研究者やAI研究者、エンジニア、科学者、学術研究者、プログラマー、クリエイティブ分野の専門家などの活用が期待されている。

 とはいえ、普通のビジネスユーザーが対象外ということはもちろんない。一般的なビジネスシーンでもこの性能の恩恵を受けられるシーンは多い。例えば、複数の文献から関連情報を抽出し、新しい知見に基づいた仮説立案を支援してくれる。世に広く出回った情報だけでなく、海外の最新論文も自分のソースとして活用できるのでアンテナ感度を高められる。

 従来は、議事録を作るだけだった会議の文字起こしから、発言を分析し、発言内容や影響力などから人事評価指標にすることもできる。チーム内のモチベーションアップやコミュニケーション改善に活用することもできるだろう。

 さらに新規事業アイディアの創出など、イノベーションにも大いに役立ってくれることだろう。経営者の壁打ちから、メンタルの相談までできる。海外顧客とのコミュニケーションも円滑化でき、中小企業の海外進出の一助にもなるだろう。

 ほかにもビジネスではないが、小説や脚本、作詞といった活用も期待されている。ChatGPT 4oなど、これまでのAIでは難しかったのだが、o1 Proならなかなかのレベルで生成してくれるのだ。来年は作品を作ってみようと、筆者も挑戦中だ。

 そして、恐るべきことに12月20日、OpenAIは「o3」と「o3 mini」を開発したと発表した。「o2」をスキップしたのは商標の問題だそう。「o3」は「o1」の強化モデルで、ベンチマークスコアも大幅に上回っている。しかも、従来の指標では「o3」の性能を計測しきれなくなっており、「ARC-AGI-1」というテストを使ったところ、87.5%と記録。人間の平均が84%なので、もう人間より賢いと言っていいだろう。「o3 mini」は2025年1月末に提供される予定だ。

 兎にも角にも、推論に強いAIに触り始めることをお勧めする。Gemini 2.0 Flash Thinkingなら無料なので、今すぐログインして「Gemini 3.0が出たとしたらどんな世界になりそうか妄想して」と入力しよう。どんな未来が来るのか、2,000文字オーバーの文章で教えてくれることだろう。

来年2025年1月に「o1」を大幅に強化した「o3」が登場予定

著者プロフィール:柳谷 智宣

IT・ビジネス関連のライター。キャリアは26年目で、デジタルガジェットからWebサービス、コンシューマー製品からエンタープライズ製品まで幅広く手掛ける。近年はAI、SaaS、DX領域に注力している。日々、大量の原稿を執筆しており、生成AIがないと仕事をさばけない状態になっている。

・著者Webサイト:https://prof.yanagiya.biz/

柳谷智宣のAI ウォッチ! 記事一覧