ニュース

「Windows AI API」が拡充、「ビデオ超解像」「Stable Diffusion XL」もカバーへ

「Copilot+ PC」でローカル実行、モデルのセットアップも「Windows Update」任せ

「Windows AI API」が拡充、「ビデオ超解像」「Stable Diffusion XL」もカバーへ

 米Microsoftは11月18日(現地時間)、テクニカルカンファレンス「Ignite 2025」で新しい「Windows AI API」を発表した。「ビデオ超解像」(VSR)と「Stable Diffusion XL」(SDXL)がラインナップに加わっている。

 「Windows AI API」は、「Copilot+ PC」に搭載されているAIプロセッサー「NPU」を活用したAI機能をアプリ開発者が手軽に利用できるようにするAPI。クラウドサービスではなく、ローカルのAIモデルを利用するため、インターネット接続のない環境でも動作するうえ、プライバシー漏洩の心配が少ないのも魅力だ。必要なモデルは「Windows Update」を介して自動でダウンロードされるため、ユーザーがわざわざWebでモデルを検索して、手動でセットアップする必要もない。

「SDXL」などの必要なモデルは、「Windows Update」を介してダウンロードされる

 「Windows AI API」で現在サポートされているAI機能は、以下の通り。

  • Phi Silica:ローカルデバイス上で言語処理タスクを実行する小規模言語モデル(SLM)。テキスト生成や要約、リライトなどが可能
  • テキスト認識:スキャンした紙の書類など、画像に含まれるテキストを認識して、検索可能なデータへ変換
  • イメージ超解像(Image Super Resolution、ISR):画像のアップスケールやシャープ化で品質を改善
  • 画像のセグメント化:画像に含まれるオブジェクトを識別する
  • 画像を説明するテキストの生成
  • オブジェクトの消去:画像の被写体を削除

 今回のアップデートでサポートされたAI機能は、以下の3つだ。いずれもパブリックプレビューという扱いとなっている。

  • ビデオ超解像(Video Super Resolution、VSR):AIを活用して低解像度ビデオストリームの画質を高めたり、フレームレートを向上させる技術
  • Stable Diffusion XL(SDXL):Stability AI社が2023年に発表した画像生成モデルで、テキストで説明した通りの画像を生成できる。既存の「Stable Diffusion」モデルよりもコントラスト、ライティング、影の表現に秀でており、ネイティブで1,024x1,024解像度を実現しているのが特徴。従来のモデルが苦手としていた手の表現、テキスト入りの画像、奥行きのある構図なども得意としている
  • アプリコンテンツ検索(App Content Search):アプリにセマンティック検索(字句一致ではなく、自然言語による説明にマッチするものを検索)などのAI検索機能を追加
「SDXL」で画像の生成やリスタイルを実行

 なお、実際の動作やサンプルコードは、「AI Dev Gallery」アプリ(プレビュー)で確認できる。ただし、APIによっては動作確認に「Windows Insider Preview」ビルドが必要になることがある点には注意したい。

「AI Dev Gallery」アプリ(プレビュー)