ニュース

「Opera」が「Google Cloud」と提携、AIモデル「Gemini」を統合へ

AI機能「Aria」に画像を理解する力。被写体や撮影場所を調べたり、OCRとして機能

「Google Cloud」と提携し、AIモデル「Gemini」を「Opera」のAI機能「Aria」に統合

 ノルウェーのOpera Softwareは5月28日(現地時間)、「Google Cloud」と提携し、AIモデル「Gemini」を「Opera」のAI機能「Aria」に統合したと発表した。

 「Opera」の開発チームは最近、AI機能「Aria」を軸にWebブラウザーを再構築するという「AI Feature Drops」イニシアティブを推進中だ。「Aria」はさまざまなAIプロバイダーやモデルの窓口と言える存在で、すでに約50のモデルファミリー、150以上のローカルLLMバリエーションをサポートしており、ユーザーはその中から、自分のニーズに適したものを選べる。今回、GoogleのAIモデル「Gemini」がサポートされたことで、「Aria」の活躍の幅はさらに広がるだろう。

 その具体的な例としては、併せてアナウンスされた「Aria」の画像認識機能が挙げられるだろう。「Aria」へ写真を送って被写体や撮影場所を調べたり、OCRのように写真に映っているテキストを理解して、テキストへ変換することができる。テキストからオーディオへ変換するモデルにも対応しており、結果を読み上げることも可能だ。

「Aria」へ写真を送って被写体や撮影場所を調べる
手書きのPythonコードが書かれた画像をOCR

 これらの機能は現在、開発者ストリームで体験可能。ダウンロードは無料だ。大きな問題がなければ、近いうちに製品版にも導入されるだろう。