高橋忍のにゃんともWindows

Windows 10でも日本語の音声入力ができるようになるみたいです!

 スマフォでもタブレットでもすっかり音声での入力が浸透しています。日本語は漢字変換棟もあり、音声入力が比較的難しい言語ですが、それでも年々精度が高くなってきています。

 人によっては長文入力を音声で入れているライターさんもいるとか。それだけ精度が良くなって来ているんですよね。これもクラウド&AI&皆さんが使ったからです。

日本語入力の精度が上がったのは何故?

 別に日本語の発音から科学的に法則を見出し、解析できるようになったわけでは有りません。音声認識エンジン自体は翻訳エンジンのように日本語を構造的に解析してるわけでは有りません。音声認識とは簡単に言うと、入ってきた音声を過去の音声パターンデータと比較して一番近い言葉を当ててるだけです。これで無限とも言える音声に対応できるのか?と思いますが、これができるようになったのは膨大なクラウドパワーと&AIによるパターンマッチング学習作業の賜物です。

 でも、AIが学習するためにはそもそも膨大なサンプルがないと何も覚えません。では誰がサンプルを提供したのかと言うと、みなさんがスマフォを通じてサンプルを提供しているわけです。だからAppleとGoogleの音声認識の制度が高いのです。スマフォ経由で入ってくるサンプルの量とそこへの投資が桁違いだからです。

Microsoft は?

 MicrosoftもCortanaやWindows Phoneを通じてチャレンジしました。英語はかなり精度が上がっていますが、やはり他の言語となるとGoogleやAppleよりも精度が落ちると思います。そんなこともあり、Windows 10での音声入力、いわゆるディクテーションは英語を始めとする一部の言語にのみ限定しています。

 そう、Windows 10には音声入力があるんです。ただ、残念ながら、今は英語にしか対応していないので、日本語入力時は使えません。ですので、[Windows]+スペースキーを押して、英語入力モードに切り替えたときだけこのディクテーションが使えます。

 実際に使う場合は、英語入力モードでテキスト入力できる状態で[Windows]+[H]キーを押して音声入力機能を起動します。音声入力のバーが出てきて、音声での入力を始めることができます。このまま音声で文字入力ができます。コマンドもいくつか使えて、『,』なら“Comma”、『.』なら“Period”、『"』なら“Open Quote”・“Close Quote”といった感じでコマンドを話せばOKです。

 Windows 10 1909では英語(米国)のみ、Insider Preview 18885で英語、フランス語、イタリア語、ドイツ語、イタリア語、スペイン語、ポルトガル語、中国語のみ対応しています。

Windows 10 Insider Previewでは日本語の音声入力が可能に

 さて、日本語には対応していなかった音声入力機能ですが、「Windows 10 Insider Preview」Build 19592で、日本語の音声入力が実装されていることに気が付きました。気が付きましたという曖昧な言い方をしているのは、実装されたことがリリースノートでも確認できていないのでわからないのです。(どこかに書いてあったらごめんなさい)

 初めは、スクリーンキーボードの左上にマイクのアイコンが付いていることで気が付きました。

 英語モードのスクリーンキーボードでは左上にマイクのアイコンがあって、ディクテーションを切り替えて使えていたのですが、以前は日本語のキーボードにはこのマイクアイコンがありませんでした。勿論スクリーンキーボードからだけではなく、英語とおなじように[Windows]+[H]キーで、ディクテーションウィンドウを起動して音声入力ができます。

使えそう?

 まだ、これは正式なバージョンではないんだと思います。例えば、英語では“Comma”や“Period”と言えば、句読点や読点が打たれますが、日本語では“句点”や“読点”と言っても、“点”あるいは“丸”といってもそのまま文字で打たれてしまいます。また、変換はすこし間があくと自動的に確定され、変更はできませんが、IMEがベースになっているだけあってかなり高い精度で変換されます。WindowsやIMEもアルファベットで打たれるのは素晴らしいですね。

 今のところ再変換は自分でやらないといけないですし、入力中にキーボードで『、』や『。』を入力するとその時点で音声入力モードが止まってしまいます。再度始めるには、[Windows]+[H]キーを2回(解除→起動)押す必要があります。

 しかし、予想以上に変換精度が高い上、OSの標準機能であるためどのアプリでも同じショートカットで呼び出せるのは大変嬉しいので、正式発表が待ち遠しいです。

あれ?音声認識ってもうひとつあったよね?

 もちろん、Insider Previewでない今のWindows 10ではこの機能はまだ使えないはずです。

 そして、Windowsの標準機能の音声認識といえば、これがありました。「Windows 音声認識」です。

 このWindows 7の頃にあった音声入力機能は絶対におすすめしません。ハングアップするわ、認識精度は笑えるくらいに低く“絶対に使わないで下さい”と言いたいくらい(ちゃんと使えている方がいたらすいません。私はダメでした)。

今やりたいなら「Google ドキュメント」

 では、待つしかないのかと言うと、音声で文書をするという限定的な目的なら、「Google ドキュメント」を使ってみて下さい。使う時は「Google Chrome」で開きましょう。残念ながら「Microsoft Edge」やIEでは音声入力機能は使えません。

 ツールに[音声入力]があるので、クリックするとマイクのアイコンが表示されます。これを押せば文書の音声入力ができます。

 「Google ドキュメント」での日本語の音声入力は、非常に精度が高く、かなり速く話してもしっかり変換されるので実用的です。それだけでなく、キー入力を途中で行うことができるので、読点、句読点の入力だけでなく、文字の修正や改行もできます。“音声入力→誤変換をDELETE→続けて音声入力”という作業をスムーズに行うことができます。

 Windows 10の音声入力もこのようになってくれると大変嬉しいです。

にゃんとも:肉球入力

 猫はキーボードが好きです。キーボードの上をよく歩いていったり、キーボードの上でよく寝ています。何故かキーボードです。彼らは素晴らしい才能が有り、キーをいくつか売ったあとによくEnterキーも押してくれます。おかげでPCをつけっぱなしで寝た時に深夜に怪しいツイートがされてしまったことが有りました。

 キーボードをちゃんと仕事で使うためにも、キーボードに変わる猫の好むデバイスを模索しないといけません。

Line スタンプ公開中

 「ノル猫たちの楽しい毎日」 「ノル猫たちのハッピーライフ」Lineスタンプ公開中です!