開発者と読み解くAIの世界
いま注目すべき「AIエージェント」とは?
「チャット型AI」の先を行く未来の体験
2024年11月28日 09:00
2024年11月19日から22日にかけて米シカゴで開催された「Microsoft Ignite 2024」では、多数の新たなサービスが発表されました。その中で特に繰り返されていたのは「AIエージェント」というキーワードです。
プレゼンテーションの中で、Microsoftのサティア・ナデラCEOは、これからのコンピューティングは「 エージェンティックワールド(Agentic World) 」の時代であるとも言及。ではこの「AIエージェント」とは一体何を指すのでしょうか。
「AIエージェント」って何?
「AIエージェント」とは、ユーザーの指示に基づいてタスクを自律的に実行するAIシステムを指します。たとえば、情報収集、データ整理、スケジュール調整、さらには外部ツールやサービスとの連携を通じて複雑な業務をこなします。
いわゆるAIチャットサービスとの違いは「目標に向けて自分で計画を立てること」「自律的に動作すること」です。
普通のAIチャットサービスは、ユーザーによる細かな指示に基づいて動作します。一方、AIエージェントは「◯◯をしておいて」というゴールを伝えると、AIエージェント自身が目標に基づいて必要なタスクを分解し、各タスクの実施状況をもとに自律的に行動します。そのため、ユーザーからの介入を必要としないことが大きな特徴です。
誤解を恐れずに一言でいえば、AIエージェントとは「人がいちいち細かな指示を出さなくても、知識をもとに行間を読みながら自分でやることを考えて、さまざまなツールを使い分けながらタスクをこなしてくれる新たなソフトウェア」なのです。
「AIエージェント」が世の中をどう変えるか?
AIエージェントは、すでに実社会にも登場しはじめており、実用化されたサービスも多数存在します。ここからは、AIエージェントを搭載した “一歩先” の未来を示す代表的なサービスをいくつかご紹介します。
Anthropic Computer Use
Computer Useは、人間のかわりにコンピューターを操作を行うAIエージェントです。
たとえば「近所のハンバーガーショップのメニューを調べて、表計算ソフトに整理して」などと、ユーザーが行いたい操作をAIエージェントに問いかけると、画面のスクリーンショットを逐次取得して画面内の状況を自律的に判断しながら、マウス操作やキー入力を人間の代わりに行ってくれます。
現状はベータ版であり、正常に動作しない場合もあるものの、将来的には、コンピューターを使うのが苦手な人にとって強い味方となるでしょう。
Genspark Autopilot Agent
Genspark Autopilot Agentは、優秀なアシスタントのように調査・データ収集・事実確認といったタスクをこなす、リサーチに特化したAIエージェントです。
ユーザーが「◯◯について調べて」と依頼するだけで、AIがバックグラウンドで作業を進め、数十以上の情報源から詳細に調査を行います。その後、調査結果をまとめたレポートを作成して提供します。
Genspark Autopilot Agentの最大の特徴は「非同期」である点です。調査が完了すると、AIエージェントがユーザーに通知してくれるため、あたかも優秀なリサーチャーが「タスクが完了しましたよ」と声をかけてくれるような感覚を味わえます。
Last week on Sep 18th, we introduced the world’s first asynchronous AI agent - Genspark Autopilot Agent. Only one week later, we’ve got an exciting update coming your way! Stay tuned to see how it’s evolving!pic.twitter.com/hQM6SO9FZ0
— Genspark (@genspark_ai)September 24, 2024
Replit Agent
Replit Agentは、コード生成と開発支援を行うAIエージェントです。自然言語での指示をもとに、フロントエンドからバックエンド、データベース連携まで含めた完全なWebアプリケーションを自動生成することができます。
ユーザーが「ToDoアプリを作って」といった簡単な指示を入力するだけで、Replit Agentがシステム仕様や必要なファイルを自動的に判断し、Webアプリをリアルタイムで構築します。Amazon Web Serviceなどのクラウド環境にアプリを実際にデプロイすることも可能です。
プログラミングの知識がなくても本格的なWebアプリケーションの開発ができることが特徴で、実際に高齢者向けの服薬管理アプリや、ログイン機能付きのイベント管理サービスなどが、コードを1行も書くことなく開発されています。
Moonhub
Moonhubは、企業の採用活動を手伝う採用特化型のAIエージェントです。
開発元のMonnhub社は、LinkedInやGitHub、SNSや学術論文をはじめとしたWeb上のデータをもとに、10億人以上にものぼる巨大な求職者データベースを構築しています。AIエージェントはそのデータベースをもとに、企業からのリクエストに応じて、マッチする候補者に対して自動でスカウト送付を行います。
目指しているのは「ベイエリアにいるアイビーリーグ出身者2名と面談を設定して」と入力するだけで、連絡から面談の日程調整まで全自動で代行してくれるような、全自動のAIリクルーターです。
AIHawk
企業が採用活動にAIエージェントを使いはじめている一方、求職者向けのAIエージェントも登場しています。
AIHawkというプロジェクトでは、AIによる全自動での仕事探しに挑戦をしています。AIHawkの開発者によれば、24時間で1,000件の求人にAIエージェントが自動的に応募し、開発者が寝ている間に50件の面接を獲得してきたとのこと。
仕事探しをAIエージェントがサポートしてくれる未来も、もうすぐ到来するのかもしれません。
もはやインターネットは「人間だけのもの」ではない
数年後の未来に確実に起きること、それは「インターネットの利用者が人間だけではなくなる」ということです。
さきほどの例で示したように、AIエージェントは「ブラウザー」「検索エンジン」「クラウドサービス」「転職・求人サイト」といった外部ツールを使い分けることが可能です。これらが示すのは、インターネットサービスの利用者はもはや人間だけでなく、AIエージェントが各種サービスを操作するようになるという未来です。
ここから言えるのは「人間にとって使いやすいサービス」ではなく、「人間だけでなく、AIにとっても使いやすいサービス」が必然的に求められる時代が来るということです。
このトレンドを象徴する出来事が、つい先日もありました。大手決済代行会社Stripeが、AIエージェント向けに構築されたソフトウェア開発キット(SDK)を発表しました。このキットを利用することで、AIエージェントが支払い・請求・発行などを行うことができます。
つまり、これまでは「人間が決済するためのツール」のみが提供されてきましたが、Stripeは新たに「AIエージェントが決済するためのツール」を提供しはじめたのです。
「『夕食にヘルシーなものが食べたいな』とAIエージェントに伝えただけで、AIエージェントがUber Eatsで健康的なメニューを選び、デリバリーの注文をして支払いまで完了してくれる」という魔法のような体験は、実はそう遠くない未来にまで近づいているのかもしれません。
著者プロフィール:高橋 椋一
東京工業大学大学院 社会理工学研究科を修了後、NTTデータに新卒入社しAI・ロボティクス技術の研究開発に従事。その後、ソフトバンクとグッドパッチを経て、2023年7月にAlgomaticへ参画。AIエージェント技術の社会実装を目指し、現在はグループ会社のAlgoamtic Worksで、COOとして事業開発を推進している。
・株式会社Algomatic:https://algomatic.jp/