音声入力日記

音声入力メインで書く日記です。実験&整理して話すトレーニング。

iOS音声認識すごいわ。

今日の音声入力はiOSにしました。誰かのFacebookに書かれていたのですがiOS音声認識がすばらしいそうです。確かにここまでしゃべってみた感触だとGoogle音声認識よりも変換精度ですとか認識精度が数段上という印象持っています。 何よりiPhoneを手元に持ってしゃべるだけという手軽さが素晴らしい。入力のノートには一応Evernoteを使っています。

とゆうかこれまでのところほとんど変換しなおしとか打ち直しがない。これは素晴らしい。どのようにしてこの変換精度の高さまでチューニングしてきたのか非常に気になるところではあります。

ということで結論からするとiOSの音声入力最高ということで明日以降はこれを使ってものすごく手軽に日記が書けるなと思います。

もはやこれは書くと言うより喋るですね。そのまま文字テキストになると言うのは口述筆記はじまって以来のイノベーションなのではないでしょうか。

便利な反面当然しゃべるものがそのままテキストになっていくと編集プロセスが入っていないからまぁ見てわかるとおりまとまりがないわけです。

それでふと思ったんですが僕は最近のテレビ番組特にNHKの番組にものすごく違和感を感じています。それは何かと言うと出演者やインタビューされた人がしゃべる言葉を全て字幕化していることです。

その人たちがしゃべる言葉はテキスト化されると言う合意がなされた上で喋っているものなのでしょうか。おそらくそんな事はなくて特に一般の人であれば思うがままに喋っているはずです。それをそのまま字面で可視化されてしまうと、本質的なフィーリングに誤解が生じるのではないかと僕は懸念しています。

大体なんでそんな字幕をつけたがるんですかねよくわかりません。視聴者サービスのつもりなんでしょうか。恩恵を受けている人がいるとすれば何らかの理由で音を聞くことが許されない環境でテレビを見ている人ということになるでしょうか。そんな人いるんですかね。

そんなことを思うとやっぱりラジオとかPodcastと言うのがいいですね。音しかないがゆえに想像力で広がる世界が映像や文字よりずっと深いものを心象に生み出してくれるような気がしています。