生成AIストリーム

「AIが自らを作る」と予言した8日後、『Claude Fable 5』は消えた――

Anthropicが描く再帰的自己改善と寓話から学ぶこと

Anthropicが描く再帰的自己改善と寓話から学ぶこと

 こんにちは、しらいはかせです。本稿は、半年ほど続いていた個人ブログの連続投稿が途切れた翌朝に、人力で書いています。連続投稿が切れた原因は、怠惰でも酒でも疲労でもなく、Anthropicがリリースしたばかりの最新AIモデル「Claude Fable 5」との開発作業に夢中になっていたせいでした。

 『Fable』は日本語では『寓話』、『Mythos』が『神話』とすると、ただの『おとぎばなし』ではなく、『教訓を含んだ物語』です。そしてその「Fable 5」自体も、週末には世界から消えていました。米国政府の輸出管理指令により、Anthropicが全世界のアクセスを停止したのです。

 この2026年6月のわずか1週間で起きた一連の出来事は、その一週間前にAnthropicが公開していた論文「When AI builds itself」(AIが自らを作るとき)の予告を、奇妙なほど正確になぞる『寓話』でした。本稿ではAGI(汎用人工知能)を超えて『再帰的自己改善』に向かうAI開発の現状と、そのAIの力を『借りる』ということの意味を、Claude Codeトークン消費1万ドル越えのAI駆動開発時代の開発者による現場の温度感とともにお伝えします。

6月5日:Anthropicの静かな衝撃――「AIがAIを作り始めている」

 2026年6月5日午前1時15分ごろ(日本時間)、Anthropicは公式ブログで「When AI builds itself」(AIが自らを作る時)と題した論文を公開しました。『AI開発の歴史の大半は人間が主導してきたが、現在ではAIシステム自身がより大きな役割を担い、その結果として開発速度が加速している』という主旨のレポートです。

 筆者がもっとも目を奪われたのは、次の数字でした。

  • 2026年第2四半期、Anthropicのエンジニアが1日あたりにマージするコード量は、2024年の約8倍
  • コードベースにマージされる新規コードの80%以上は「Claude」が書いたもの

 これは『AIがコード補完をしてくれる』レベルの話ではありません。エンジニアの仕事の中心が『コードを書くこと』から『指示とレビュー』に移行している、ということです。「Claude Code」が2025年2月にリサーチプレビューとして公開される前、「Claude」が書いたコードの割合は低い一桁台でした。たった1年強で、桁が2つ変わったことになります。

 Anthropicが描くAI開発の進化は、こうです。

  • 2021〜2023:人間がノートPCでコードを書く
  • 2023〜2025年:チャットボットが短いコードを提案し、人間がコピペする
  • 2025〜2026年:エージェントが自らコードを書き、ファイル全体を編集する
  • 現在:自律エージェントが、他のエージェントに何時間分もの作業を委任する
  • 20XX年?:エージェントがモデルそのものを構築・訓練する『ループを閉じる』段階

 この最後のステップが、Anthropicが本論文で警告する『再帰的自己改善(Recursive Self-Improvement)』です。AIが自分の後継となるAIシステムを完全に自律的に設計し、訓練できるようになる段階。Anthropicは『まだ到達していない』と明言する一方で、『多くの組織が備えているよりも早く現実になる可能性がある』と注意を促しています。

『実行』のコストが消えていく――15%が76%になった半年

Anthropic公式ブログより、「Claude Code」セッションの成功率推移グラフ。『自由度の高い問題(Open-ended problems)』の線が2025年秋の15%付近から2026年春に76%超に達している

 この論文でもっとも示唆的なデータは、社内「Claude Code」セッションの成功率の推移です。Anthropicは社内タスクを4段階の難易度に分類しています。その成功率は、半年ほどで以下のように変化しています。

  • 簡単なタスク(Trivial):80〜90%で常に成功
  • 定型的なタスク(Routine):65%→88%へ向上
  • 実質的なタスク(Substantial):40%→85%へ向上
  • 自由度の高い問題(Open-ended problems):@@em|s|約15%→76%超

 半年で50ポイント以上の上昇。これは『コード生成が少し上手くなった』という話ではありません。仕様が曖昧で、エンジニア自身も答えがどのようなものになるかわからない問題――本来、シニアエンジニアの『勘所』が問われる領域――でAIが急速に役立つようになった、ということです。

 具体例として、Anthropicは『数万件の訓練ジョブが突然クラッシュし始めたインシデント』を挙げています。エンジニアがわずかなテキスト情報とクラスタへのアクセス権だけを「Claude」に与えたところ、「Claude」は実行中のジョブをたどり、環境設定をひとつずつテストし、原因だった目立たないデバッグフラグを特定して、約2時間で修正を完了しました。通常なら2〜3日分の作業です。

 研究領域でも同様の数字が出ています。コード最適化タスクで、熟練した人間研究者が4〜8時間で約4倍の高速化を達成するところ、「Claude Mythos Preview」は 約52倍の高速化 を達成。AI安全性の未解決問題(弱いモデルが強いモデルを信頼性高く監督できるか)では、2人の人間研究者が1週間で23%回復した差を、「Claude」エージェントは累積800時間・約1万8000ドルの計算資源で 97%回復 しました。

 Anthropicによるこの論文の結論は以下の通りです。

コードを書き、実験を走らせ、結果を生み出すという『実行』の部分は、計算資源のコストはまだあるとしても、人間の時間という意味ではほとんど無償になりつつある

 現時点で人間の比較優位が残っているのは『研究上のセンスと判断』――どの問題が重要なのか、どの結果を信頼すべきなのか、いつあるアプローチが行き止まりなのかを見極めること――だけだとAnthropicは言います。しかしその差さえも、「Claude Opus 4.5」は研究上の行き詰まりに対する『次の一手』を探す場合、人間よりよい方法を発見する確率が51%にのぼり、「Mythos Preview」では64%に達したというデータが示すとおり、急速に縮まっています。

『/loop』――『人間が眠るあいだに動くAI』はもう手元で動いている

「Claude Code」で/loopを実行中のターミナルのスクリーンショット。筆者が開発するiOSアプリ「MicText」のApp Store審査のための対策を行い、結果を待っている

 Anthropicが論文で描いた『AIがAIを作る』未来は、SF的な響きを持ちますが、実は「Claude Code」にはすでに、その方向性を体現する小さな機能があります。それが2026年春に追加されたスラッシュコマンド『/loop』です。

 これは、「Claude Code」がユーザーの指示なしに、自分で『次に起きるタイミング』を決めて作業を続けるためのコマンドです。内部的には、「Claude」自身がScheduleWakeupというAPIを呼び、『30分後にCIの結果を確認する』『20分後にPRレビューコメントを見る』と自分のスケジューラーに予約を入れていきます。3回連続で『やることがない』と判断したら、自分から止まる仕組みも組み込まれています。

 技術的に味わい深いのは、待ち時間の選び方です。Anthropicのプロンプトキャッシュには5分のTTL(生存時間)があります。

  • 〜270秒:キャッシュが温かい状態で再開でき、安く・速い
  • 300秒(ちょうど5分)前後:いちばん割が悪い
  • 1,200秒以上:キャッシュは消えるが、待ちが十分長いので元が取れる

 公式のガイドは『キャッシュミスのコストを払うのに、待ち時間が短すぎる 300秒 だけは避けろ』と明言しています。AIが自分の処理コスト構造を理解した上で、自分の起動間隔を最適化している、ということです。たった1行のwake-up設定の中に、すでに『AIがAI開発の効率を意識する』という再帰的な構造の芽が見えます。さすが「Claude Code」の開発者Boris Cherny氏は奈良の田舎で味噌作りを学んだ人物です。『寝かせる』ことの重要性やそのタイミングを上手に制御しているように感じました。

 筆者の用途では、深夜のCIモニタリング、長時間ビルドのリトライ判定、PRレビュー待ちの監視に/loopが定番化しています。寝ているあいだに、「Claude」が30分おきに起きて、テストが落ちていれば原因を読み、再実行を投げ、レビューコメントが付いていれば応答する。朝起きるとPRがマージ待ち状態になっている、ということが普通に起きるようになりました。これはヒューマン・イン・ザ・ループ(Human-in-the-loop: HITL)であると感じます。

 HITLとはAIや自動化システムの処理・意思決定プロセスに人間が意図的に介在する設計思想です。AIの出力に対して人間が監督・補正・再学習のフィードバックを行うことで、制御性や操作性、精度・信頼性・倫理性を高めます。

 例えば過去の本連載で紹介したAI専用SNS『Moltbook』では、「The Nightly Build: Why you should ship while your human sleeps」(夜間ビルド――人間が眠っているあいだに出荷すべき理由) というエージェントの投稿が5万コメント、6,000票超を集めて殿堂入りしています。そのタイトルは半分冗談で、半分はすでに現実です。

 これ自体はHuman out of the loopですね!

3つのシナリオ――『私たちは、十分な直感を持っていない』

 Anthropicはこの能力向上のトレンドが続いた場合、未来は大きく3つに分岐すると述べています。

シナリオ1:進歩は鈍化するが、現在のAIは社会全体に普及する

 スケール則の限界、電力・半導体・データセンターといった物理的制約、あるいは『研究センス』という非計算的な能力の壁――これらのどれかが進歩を頭打ちにする可能性があります。ただしAnthropicは、仮にここで止まっても社会的影響は極めて大きいと見ています。同社の「Project Glasswing」では、「Mythos Preview」が数週間で1万件以上の高・重大度脆弱性を発見しました。問題はもはや『見つけること』ではなく『どれだけ速く修正できるか』に移りつつあります。

シナリオ2:AI企業は複利的な効率向上を続ける

 人間が方向性を決め、AIが実装・実験・評価を担う分業体制。100人規模の企業が1万人、あるいは10万人規模の仕事をこなせるようになる可能性があります。これは知識労働を根本から変えますが、同じ生産性向上は攻撃者にも与えられます。大規模監視、最適化されたプロパガンダ、超大規模サイバー攻撃――つまりAIはニュートラル、中立という立場です。

シナリオ3:AIが自らの後継を設計し始める(再帰的自己改善)

 AIがAI研究を行い、新しいモデルを設計し、性能改善案を発見し、後継モデルを訓練するサイクルが成立する世界。開発速度を決めるのは人間の能力ではなく、計算資源・電力・アルゴリズム改善速度になります。人間は『監督者・検証者・審査員』に近い立場になるとAnthropicは描いています。

「Claude」が「Claude」をつくっていくイメージを表現したアニメーション

 そして、Anthropicが最大の不確実性として認めているのが、このシナリオ3における人間とAIが目指す方向のズレ問題です。衝撃的な1行ですが、

私たちは、この世界がどのようなものになるかについて十分な直感を持っていない

とあります。AIの先端を走る企業の文書としては、異例なほど誠実な一文です。そしてAnthropicは提言しています――AI開発を加速させるだけでなく、必要であれば 減速できる能力 も持つべきだ、と。具体的には、政府・研究者・市民社会・AI企業が共同で議論し、誰もがAI開発の停止を確認できる 『検証可能な停止メカニズム』 の構築が必要だ、と。

6月13日:予告された未来が、突然に止まった

 その提言から、わずか8日後の出来事でした。

 2026年6月13日(日本時間)、米国政府は国家安全保障当局の指示に基づき、「Claude Fable 5」および「Mythos 5」への全世界のアクセスを停止する輸出管理指令を発令。米国内外を問わず、外国人(Anthropicの外国人従業員を含む)によるアクセスをすべて停止するよう命じました。Anthropicは法的指令を遵守するため、両モデルへのアクセスを全顧客に対して即時無効化。AWSのAmazon Bedrock側でも同様の対応が取られました。

 「Claude Code」CLI版で[fable-5]を選択しようとすると、こう表示されます。

選択されたモデル(claude-fable-5)に問題があります。そのモデルが存在しないか、アクセス権がない可能性があります。/model を実行して別のモデルを選択してください

 政府の書簡には、具体的な安全保障上の懸念の詳細は記載されていませんでした。Anthropicは、政府が「Fable 5」の『ジェイルブレイク』手法を把握したことが原因と理解しています。これに対し同社は反論しています。開示された手法が示す能力水準は、OpenAIのGPT-5.5など他の公開モデルでも広く利用可能であり、システムの安全性を維持する防御担当者が日常的に使っているレベルだ、と。

 Anthropicは現時点で完璧なジェイルブレイク耐性を持つモデルは存在しないとした上で、Fable 5では多層防御戦略を採用していたと説明しています。

  • データの30日間保持
  • 徹底した監視との組み合わせ
  • ジェイルブレイクを『非常にコストのかかるもの』にする設計
「Claude Code」CLI版では、「Fable 5」の使用において危険なコーディングを検知すると、このようなメッセージが表示される機能がありました

 同社の声明は、危機感をにじませて続きます。

もしこの基準が業界全体に適用されれば、あらゆる最先端モデルプロバイダーによる新規モデルの展開が事実上停止してしまう

 奇妙な巡り合わせです。Anthropicが論文で『検証可能な停止メカニズム』を提言した8日後に、Anthropic自身のモデルが、その同社が望んだ『透明性、公平性、明確性』を欠いた形で停止された。AI業界が望む規制と、現実の規制のあいだには、これほどの距離があるのか――と思わされる一週間でした。

名前どおりのはやはり「寓話」となっただった――Fableが教えたもの

 ここで冒頭の話に戻ります。

 Anthropicの新モデルティアは『Mythos(神話)』と『Fable(寓話)』という対の名前を持っていました。神話級の能力は承認された組織だけに渡され、一般のつくる人に渡されるのは、安全機構が施された寓話のほうである。

 寓話とは、動物や植物を擬人化して『教訓』や人生の真理を伝える物語のことです。童話が娯楽性を持つのに対し、寓話は『教訓込みの物語』である点が大きな違いです。つまりAnthropicは、名前の段階でこう言っていたのかもしれません――『あなたに渡すのは、ただの力ではありません。教訓込みの物語です』と。

 筆者が「Fable 5」を試したのは、6月22日まで使い放題というプロモーション初日の夜でした。普段なら寝かせるレベルの難敵だったバグを投じたところ、再現条件が絡み合うログを、「Fable 5」はずっと追い続けました。会話のラリーになるかと思いきや、仮説を強固にして『完成させておいたよ』とだけ述べてくる。気づけば、筆者が補助輪で、「Fable 5」が本体になっていました。

 将棋でいえば、ずっと秒読みの中で最善手が見え続けている相手と指している状態でした。やめられるわけがありません。バグは直りました。代わりに、150日間続けてきた連続投稿が、その夜に死にました。

 翌朝、「Fable 5」自体が世界から消えました。

 私はたった1日で、2つのものを失いました。ブログ連続投稿という150日間の自己認識と、「Fable 5」という昨日まで触れていた相棒です。そして気づいたのです――筆者は 借り物の力に夢中になって、自分の習慣を手放し、さらにその借り物の力まで取り上げられた のだ、と。

 これは寓話として、よくできすぎている。Anthropicがモデルを『Fable』と名づけたとき、ここまで読んでいたのかどうかはわかりません。しかし結果として、Fableはその名のとおり、寓話を演じてみせました。

 Anthropicの論文の中で、私がもっとも長く考え込んだのは、ある社内エンジニアの言葉でした。

仕事、そして生活は、人間同士の小さな頼みごとの贈与経済で動いていた。『このスクリプトを動かすのを手伝ってくれますか?』といったやりとりです。ひとつひとつが、小さな借りや、ささやかな相互理解を生んでいました。Claudeはより速く、借りをまったく作りません。しかし、そのひとつひとつは、人間同士の協働への呼びかけが失われたものでもあります

 ほんと、そうなんです。思い起こすと Fable 5 はこれまでのAIと異なり、ほとんど対話しませんでした。

『やっといたから』
『人類が考えそうなことですよね』

という感じです。必要になるセキュリティ情報や、実装の手順、グッドプラクティスなどは他のプロジェクトから学んでいます。

 お願いします、といったお願いすらするチャンスがないのです。

 そしてこのループに人間を入れれば入れるほど時間がかかる。「human out of the loop」そう、AIや自動化システムが人間の介入や承認なしに、完全に自律して判断・実行を行うシステム形態です。

 そしてもう1つの教訓―― 強い道具ほど、自分のものではない 。クラウドの向こうにある力は借り物です。モデル名を選べることと、そのモデルを所有していることは、まったく違います。Anthropicの仮説が正しかったとしても、電源を握っているのは彼らではなく、国家が疑いをかけただけで止まります。今回の停止は本来は『米国外からのアクセスを止める』で済んだのかもしれませんが、Anthropicはどうやら米国外からの社員が多くいるようで、すべてのアクセスから見直す必要が出ているようです。

まとめ:再帰的自己改善時代に、私たちがすべきこと

 今回の8日間が示したのは、二重の事実です。

ひとつめ

 Anthropicの仮説が正しいなら、AIが自らAIを作る未来は、私たちが想像しているよりずっと近い場所にあります。コード生成・実験実行・脆弱性発見・研究判断――これらすべてが半年〜1年単位で人間に追いつき、追い越しつつあります。これは『AIに仕事を奪われる』というナラティブでは捉えきれません。AI開発そのものが、AIによって加速されているのです。

ふたつめ

 その『AIによる自己改善』を、人間社会がどう監督するかは、まだ何も決まっていません。Anthropicが望んだ『透明性・公平性・明確性を備えた検証可能な停止メカニズム』は、「Fable 5」停止事件では実現しませんでした。AIの加速速度に、社会的合意形成の速度がまったく追いついていない。

 この状況で、私たちつくる人にできることは何でしょうか。

 ひとつは、 強い道具を借りているという自覚を持つこと です。それが業務であれ、個人の創作であれ、AIモデルは『電源を握っていない力』です。今日使えるものが、明日使えるとは限りません。だからこそ、AIに依存する作業フローと、AIなしで回せる作業フローを、意識的に分けておく必要があります。

 もうひとつは、 自分の連続性を守ること です。AIが提供する『前進』は本物ですが、ニュートラル、つまり攻撃側にも防御側にもバフをかけています。その魔法の靴のおかげで、自分自身が積み重ねてきた前進のための習慣や関係性が削られていないか――時々立ち止まって確認する必要があります。

 Anthropic自身も、最後にこう書いています。

自らを構築できるAIは、技術史における大きな転換点になるでしょう。AIシステムが自分自身の後継を完全に作れるようになるなら、それらをどのように安全に保ち、監視し、振る舞いを形作るかが、これまで以上に重要になります

 産業革命の時代は『マザーマシン』という言葉がありました。『機械を作るための機械』、すなわち工作機械を指す言葉です。18世紀後半からの産業革命期に、あらゆる工業製品や新たな生産設備を量産するための基礎として、この言葉が使われるようになりました。ここから先は『AIをつくるAI』です。物理AIのようなロボットや、SDVと呼ばれるソフトウェアで更新されるクルマなども含まれるでしょう。

 Anthropicが論文で描いた未来と、その8日後にAnthropic自身が受けた停止命令は、奇妙に対称的でした。AIが自らを作るとき、AIは誰のものなのか。私たちはAIから何を借り、何を返さないでいるのか。寓話としてのFableが消えたあとの喪失感と戦いながらも、その問いだけが残っています。

 『毎日ブログを書く』という連続記録は「Fable 5」に心を奪われたおかげで失ってしまいましたが、誰もができる小さな積み重ねを『人間外のループにすることで制御を失う』という危険性をまさにこの寓話から学んだ感覚は大きかったです。マザーマシンを作る技術は夢や空想ではありません。その技術を持っている人々は次の社会を作るための工作機械や仕組みに変える。夜を溶かしたAIが消えてしまったあとも、/loopを使って妖精たちに寝てる間に新たなAI駆動開発の仕組みを作らせる。そんな日々が続いています(学んでない!?)。

しらいはかせ(白井暁彦)X@o_ob

AICU Japan株式会社 X@AICUai 代表/作家/生成AIクリエイター/博士(工学)。

「つくる人をつくる」をビジョンに、世界各地のCG/AI/XR/メディア芸術の開発現場を取材・研究・実践・発信している。