ニュース

OpenAI、動画・音声生成モデル「Sora 2」を発表 ~iOSアプリも米国・カナダで先行提供

物理的に正確でリアル、コントロール性にも優れるのが特徴

OpenAI、「Sora 2」を発表

 米OpenAIは9月30日(現地時間)、「Sora 2」を発表した。同社の動画・音声生成モデル「Sora」の最新版で、前モデルよりも大幅に進化しているのはもちろん、物理的に正確で、リアリティがあり、コントロール性にも優れるのが特徴だ。

物理的に正確で、リアリティがあり、コントロール性にも優れる。セリフ、効果音なども生成可能

 2024年2月にプレビューが開始されたオリジナルの「Sora」が「GPT-1」だとすれば、「Sora 2」は「GPT-3.5」に相当するものだ。

 たとえば、従来の動画生成モデルは“楽観的”過ぎて、バスケットボール選手がシュートを外しても、フープにボールがテレポートして不自然におさまってしまうことがあった。しかし、「Sora 2」ならばバックボードに当たってボールが跳ね返る。無理やり“成功”させようとするのではなく、“失敗”もうまく表現できるため、物理法則にちゃんと従っているように見える。リアルな背景音、セリフ、効果音なども生成可能で、汎用の動画・音声生成システムとしての品質が向上した。

 また、スタイルの多様性も図られた。「Sora 2」はリアルな動画だけでなく、映画風やアニメ風といった多彩な動画表現が可能。生成動画に現実の人物や物体を挿入して、違和感なくフィットさせることもできる。

瞳に花火が映るアニメ表現

 「Sora 2」は、無料で利用可能(制限あり)。「ChatGPT Pro」ユーザーであれば、実験的な高品質モデル「Sora 2 Pro」も利用できる。既存の「Sora 1 Turbo」も引き続き利用可能で、生成した動画はすべて「sora.com」のライブラリから引き続きアクセスできる。

 なお、今回の「Sora 2」リリースに併せて、iOS向けのソーシャルアプリ「Sora by OpenAI」が新規に提供される。このアプリには「Sora 2」が搭載されており、動画を生成したり、他のユーザーが生成した動画をフィードでチェックすることが可能。また、「カメオ」出演機能を備えており、動画をリミックスしてユーザー自身や友人を登場させたりして楽しめる。この「Sora」アプリは若者が使うことも想定されており、未成年向けの機能制限やいじめ対策、ペアレンタルコントロールなども搭載されているという。

iOS向けのソーシャルアプリ「Sora by OpenAI」。米国とカナダで先行リリース

 「Sora」アプリはまず米国とカナダで先行リリースされ、順次他国へも展開される予定。利用は基本的に無料だ。