ニュース

OpenAIが実用レベルの動画生成AI「Sora」を発表 ~テキストから最長1分の動画を生成

映像内に映ったものが物理世界にどのように存在するのかも考慮

OpenAIが実用レベルの動画生成AI「Sora」を発表

 米OpenAIは2月15日(現地時間)、開発中の動画生成AI「Sora」を発表した。現在、レッドチーム(敵対的なテストを行うテスター)による危害やリスクの評価が行われているほか、フィードバックを得るため多数のビジュアル アーティスト、デザイナー、映画製作者にアクセスが許可されているという。

【「Sora」によって生成された動画】

 「Sora」は、複数のキャラクターや特定の種類のモーション、被写体と背景の正確かつ詳細で複雑な映像を構築できるAIモデル。ユーザーがプロンプトで要求した内容に加え、それらのものが物理世界にどのように存在するのかも考慮して最長1分の動画を生成できる。さらに、プロンプトから生き生きとした感情を表現する魅力的なキャラクターを生成でき、1つの映像内でキャラクターの姿を正確に保持した複数のショットを作成可能。

 「Sora」は、「Stable Diffusion」や「DALL-E」などと同様の拡散モデルで、静的なノイズ映像から開始して多くのステップでノイズを除去することで目的の映像を生成する。多数のフレームに対する洞察を一括で与えることで、被写体が一時的に見えなくなった場合でも同じ状態を保つという困難な問題を解決している。

 OpenAIは「Sora」が製品として利用できるようになる前に、誤った情報、憎悪に満ちたコンテンツ、偏見といった分野の専門家と協力し、重要な安全処置を講じるという。また、「Sora」によって生成されたことが検出できるC2PA(Coalition for Content Provenance and Authenticity)メタデータも含まれる予定。

 「Sora」の公式ページでは、すでに「Sora」によって生成された多数の動画が公開されている。どれも現実と区別がつかないほどのクオリティで、「Sora」の実力が伺うことが可能だ。