前の画像
次の画像
記事へ
ユーザーの意図と異なる(ミスや失敗、幻覚など)「不整合な行動」の多さを測ったテスト。「Opus 4.8」と「Claude Mythos Preview」の低さが印象的
Anthropic、「Claude Code」向けにセキュリティ監査プラグインを無償提供
2026年5月27日
Anthropic、SpaceXと計算インフラで提携 ~「Claude Code」やAPIの利用制限が大幅緩和
2026年5月7日
最新AI「Opus 4.7」と二人三脚でデザインを検討・改善できる「Claude Design」が登場
2026年4月21日
Anthropic、最新鋭モデル「Claude Opus 4.7」を発表 ~激ムズな作業も監督なしで任せられるレベル
2026年4月17日