ニュース

Windows版「Word」に文字起こし機能 ~複数話者の識別も可能

まずは「Office Insider」で。段階的に提供範囲を拡大

Microsoft、Windows版「Microsoft Word」アプリで文字起こし(Transcribe)機能のテストを開始

 米Microsoftは2月1日(現地時間)、Windows版「Microsoft Word」アプリで文字起こし(Transcribe)機能のテストを開始すると発表した。昨年末の「OneNote」アプリに続く導入となる。

 音声をテキストにする「文字起こし」は、インタビューを記事にしたり、会議の議事録を作成したり、講義のノートをとるときに役立つ機能だ。従来は耳で聞いて、キーボードで入力するしかなかったが、最近のAIの進歩により、さまざまなアプリで対応が進んでいる。

 「Word」の文字起こしは、リボンの[ホーム]タブの[トランスクリプト]ボタンから利用可能。コマンドを実行すると[Transcribe]サイドパネルが開き、文字起こしを開始することができる。

[Transcribe]サイドパネル

 文字起こしのソースには、マイクからの入力と既存の音声ファイルの両方が利用可能。ミーティングに参加しながら議事録を作成する場合は前者を、すでに録音済みのデータがあるなら後者を利用すればよい。なお、生成されたトランスクリプトデータ(文字起こしファイル)は「OneDrive」ストレージに保存されるので、「Microsoft アカウント」でのサインインは必須となる。

 「Word」の文字起こし機能は複数の話者を識別可能で、それぞれの台詞を分けてテキスト化できる。ここは1人で利用することが前提のディクテーション(音声入力)との違いといえるだろう。文字起こしした台詞に誤りがあれば、その場で修正することも可能。丸い[+]ボタンを押せば、当該する台詞がドキュメントに挿入される。

複数の話者を識別可能。文字起こしした台詞に誤りがあれば、その場で修正できる
丸い[+]ボタンを押せば、当該する台詞がドキュメントに挿入される

 本機能を体験したい場合は、「Office Insider」(「Microsoft 365 Insider」に改称予定)の「ベータ」チャネルに登録し、「Word」を「バージョン 2302」(Build 16107.20000)以降へアップデートする必要がある。一部の環境から段階的に展開されているようで、すぐには利用できないこともあるので注意したい。