「AmiVoice」を8年間使用してきて感じた「良かった点」と「悪かった点」

早いもんで、僕が最初に「AmiVoice SP」を使い始めたのが2010年の7月です。

ネタキリ生活向上ブログ。頸椎損傷C4-C5のネタキリ男が、多少不都合な生活をゲームの縛りプレイ的に楽しむブログ。この人生ゲーム(ネタキリモード)を攻略すべく、ベッド上から色々なモノを買って試したり、自作したりしてます。

現行シリーズが「AmiVoice SP2」となり、間もなく2020年にも届きそうな現在でもずっと使い続けています。

当然ながら今現在のAmiVoiceの音響学習レベルはマックスの126になっています。

photo by Matthew Keefe AmiVoice SP2の音響学習レベルが最大レベルの126になりました。 ...

そんな音声入力は、僕がパソコン作業をする上で、もはや必要不可欠なものになっています。

そんな「AmiVoice SP2」なんですが、何年も使用していると、当然ながら良い面も悪い面も見えてきます。

これは個人的に思っていることなんですが、音声入力はまだまだ発展途上です。便利な面もあれば、当然「ここはちょっとな…」という部分もあるわけです。

それでも、便利な面が上回って、僕は音声入力ソフトを使い続けています。

そんなわけで「メリット」と「デメリット」を思いつくまま、挙げて行こうかと思います。

文中に書かれているメリット・デメリットは、僕がもう1つ持っている音声入力ソフトのドラゴンスピーチ機能と比較する形も含めて書きます。
スポンサーリンク
レクタングル(大)広告

AmiVoiceを使うメリット

まずは良かったところ。

認識率が高い

僕が最初に音声入力ソフトを使ったのは、2000年ごろ。最初に使ったソフトは、IBMのViaVoiceでした。

ただ当時の音声認識ソフトは「全く使えないな…言ったことが全然文章にならない…」という印象。

けれど18年前は、全く使い物にならなかった音声入力ソフトも、技術革新が進みかなりのものになりました。特にこのSP2では、辞書も強化され高い認識率を誇ります。

文章を短く区切らずに、一文ずつを一気に読み上げることによって、より認識率も高まります。

特に使ってみて思うのは、固有名詞に強いことです。有名人や地名、作品名、サービス名、日常よく聞いたり、使ったりする固有名詞ならば、ほぼ網羅していると思います。

例を挙げると、

人名
安倍晋三、舛添要一、海江田万里、石原慎太郎、橋下徹、志位和夫、福島瑞穂、有吉弘行、吉高由里子、松本人志、宮迫博之、田村淳、三村マサカズ、徳井義実、堀江貴文、宮川大輔、羽生結弦、高橋大輔、葛西紀明、高梨沙羅、上村愛子、浅田真央、鈴木明子、村上佳菜子

地名、場所名
長万部、納沙布岬、普天間、宜野湾市、兜町、渋谷ハチ公前、赤坂、高知のはりまや橋、札幌の時計台、オランダ坂、カルガリー、アルベールビル、リレハンメル、ソルトレークシティー、トリノ、バンクーバー、平昌、(残念ながら、ソチは短すぎて措置と出た)

作品名
ドラえもん、サザエさん、ちびまる子ちゃん、こちら葛飾区亀有公園前派出所、ドラゴンボール、ワンピース、ジョジョの奇妙な冒険、北斗の拳、魁男塾、幽遊白書、HUNTER×HUNTER、風の谷のナウシカ、天空の城ラピュタ、ホーホケキョとなりの山田くん

サービス名、会社名、商品名
Google、Yahoo!、nifty、YouTube、Facebook、Twitter、Microsoft、Macintosh、iPhone、iPad、iMac、iPod、iTune、iOS、Windows Vista、Windows Me、Android、Xperia、AmiVoice SP2、DragonSpeech

こんな感じで、固有名詞が変換もなしでズバッと一発で出ます(入力を修正すると次からは、修正したものが出ます)。

僕は、ドラゴンスピーチ(DragonSpeech)も持っています。ドラゴンスピーチの語彙数は100万語、AmiVoice SP2は20万語だそうですが、正直言って、AmiVoiceの辞書の方が賢く感じます。

とにかく音声入力ソフト(AmiVoice SP2)を使えば、文章入力をする労力を大幅に下げることができます。

とにかく軽くて速い

AmiVoiceはソフトの起動から、音声入力スピードに至るまで、とにかく速いです。

僕が普段AmiVoiceを使う最大の理由がこれかもしれません。低スペックのパソコンでも快適に動きます。半面、ドラゴンスピーチは、何をするにも重くてイライラしてしまいます。

直接入力が得意

附属のエディターを使わなくても、使い慣れたエディターなどにザクザク直接入力ができます。

このブログ記事も、ブログエディターのOpen Live Writerに直接入力しています。

これに、ドラゴンスピーチを使うとエラーダイアログが出てしまってそれ以降動作しなくなってしまったり、アプリケーションが落ちたり、意図しない入力になってしまいます。

直接入力をするたびにアプリが落ちていては、イライラするのでどうしてもAmiVoiceを使用するようになりました。

安定している

AmiVoiceは、今まで1年間使ってきた中で、アプリケーションが落ちてしまったことは一度もありません。

他プロセス間での音声入力でも致命的な不具合が出ないのは流石だと思います。

逆に、ドラゴンスピーチの場合は、不具合が出ないことの方が珍しいぐらいです(ただし、直接入力せずに附属のドラゴンエディターに入力する場合はほとんど不具合は出ません)。

せっかくノリノリで、文章を入力しているのに、アプリが落ちてしまうようでは、やる気もそがれてしまいます。そういった意味で、AmiVoiceの安定感は素晴らしいと思います。

良かった点のまとめ

AmiVoice SP2の優れた点をまとめると、軽くて正確で安定してどんなアプリにでも入力できるということだと思います僕の場合は、どんなアプリにでもどんどん直接入力していきたいので、AmiVoiceを使っています。

あと、キーボード入力に比べて文章入力の速いということは、何よりの大きな魅力です。思ったことを口にすれば、95%前後の認識率で文章化してくれます。

あとはちょこちょこと、誤字を見直して直すだけです。この文書入力の気軽さが、音声入力を使う一番のメリットと言っていいでしょう。

AmiVoiceを使うデメリット

AmiVoice SP2は、優れた音声認識ソフトですが、良いところもあれば、やはり悪いところというか、難点もあります。以下ではそれを挙げたいと思います。

文章の修正が苦手

AmiVoiceは、一度確定した文節を再度切りなおして変換するということができません。

例えば、「とりの」と発声して「トリノ」と変換されてしまった場合は、もう「とり_の」といった文節にして「鳥の」に変換することはできません。

その点、ドラゴンスピーチなら音声コマンドで好きな文節に区切って文章の修正をすることができます。

詳しくは書きませんが、変換するにしても、変換候補の出方(変換候補の優先度)でも、おかしな出方をします。

キーボードを使う必要がある

AmiVoiceの場合は、文章の入力から修正まですべてを声で行うことはできません。

ですので、上肢麻痺などがあって、手が使えずキーボードが使えない人の場合は、満足に使うことができないと思います。

これはAmiVoiceが、こういった設計なので仕方のない事ではあります。すべての文章作成を声で行いたい場合は、ドラゴンスピーチが向いています。

雑音に弱い

AmiVoice SP2と、ドラゴンスピーチを比べてみて、AmiVoiceは雑音に弱いと思います。

というのも、エアコンなどの「ゴー」という音をマイクが拾うと、途端に認識率が悪くなることがあります。

その点、ドラゴンスピーチは周囲の雑音に、あまり動じません。小さなテレビの音だとびくともしないので、テレビを見ながらでも音声入力ができます。

少々雑音がある所での認識率はAmiVoiceが分が悪いと思われます(僅差ではありますが)。

どうしても誤字脱字が多くなる

これは、雑音に弱いことと関係しているのだと思われますが、雑音が入ることにより誤字脱字が混入される可能性が高くなります。

これは、音声認識ソフト全般に言えることですが、ライター本人が「サイトを」と入力するつもりでも、音声入力ソフトが「斉藤」と出力するといったようなことが結構あります。

ライターが、入力中は「サイトを」と入力されているのを目で見て、次の音声入力に移っている最中、実は入力文字は決定されておらず、いつの間にか文が「斉藤」に変換・決定されているなんてことがままあります。

これは、AmiVoice、ドラゴンスピーチにかかわらず音声入力ソフトを使っている人ならばよくある「あるあるネタ」ではないかと。

もちろん、そういった「誤字脱字を修正する時間」を含めても音声入力した方が速くて楽なので使っているわけで。

スリープ機能がない

ドラゴンスピーチの場合は、一定時間音声入力がないと自動的に音声入力機能がオフになります。しかしAmiVoiceの場合は、そういった機能はありません。

僕は、たまに音声入力機能をオフにするのを忘れてしまうことがあるのですが、生活音やテレビの音などに反応して、動作してしまい意味のない学習をしてしまいます。

AmiVoiceを使う場合は、音声入力機能の切り忘れに気をつけるか、「制御キーを押している時だけ音声入力をオンにする」という設定にする必要があります。

附属のエディターが使いづらい

とにかくエディター( AmiVoice エディター)が使い辛いです。

AmiVoice エディターを使うと逆に AmiVoice が使いづらくなってしまいます。せめて、フォントぐらいは変更できて、 Windows のメモ帳ぐらいの能力は欲しいです。

AmiVoice を使う場合は、設定の入力モードを変更して「直接モード」で使用することをお勧めします。

悪かった点のまとめ

AmiVoice SP2の悪かった点をまとめると、文章の校正(修正)が苦手で、声での修正は全く出来ないということです。

手に障害があり全ての文書作成を声で行いたい場合は、選択肢に入れるべきではありません。雑音が苦手なので静かな場所で使う必要があると思います。

あと、上の方でも書いたのですが、音声入力はキーボードで入力するより誤字脱字が多くなる傾向があります。それを含めても僕の場合は、楽だから使っている部分はあるのですが、正確性を求められる文章を書く場合は、やはりまだキーボード入力の方が信頼度は高いかと思います。

文章をきちっと校正・推敲出来る時間がしっかりと取れるのであれば、そこまで誤字脱字は問題ではないかもしれません。ただ、書いたらそのまま投稿するような日記ブログの場合は誤字脱字の混入率は高くなるかと思います。

まとめ

AmiVoiceに関しては、前バージョン(2010年)から長年使っているので、まだまだ書きたいことは沢山ありますが、主なものは大体書けたと思います。

悪かった点なども、なんだかんだで書きましたが、現時点のWindows用音声入力ソフトとしては、AmiVoice SP2がベストだと僕は思っています。

AmiVoiceの最大の売りは、早さ、正確さ、安定さだと思います。サクサクと文章を作成できるため僕も愛用しています。

製造元のアドバンスト・メディア社も、当然そこを重視しながら作っていると思われます。先日、営業担当の方にソフトに関する要望を伝えたとき、メールのやりとりした限りでは、開発コンセプトとして同様のことを言っておられました。

AmiVoiceは、文章作成に特化して、その他の機能は最小限に抑え、修正はキー入力で行い、サクサク動作、リアルタイムに認識することが特長です。

(中略)

単語数、認識率、メモリーの消費量などを考慮して、アミボイスの「サクサク感」が維持できる範囲で最大の単語数(標準大の辞書)を搭載しました。

(中略)

認識率を向上させるため、若干発話して認識結果を表示する速度が遅くなっているかもしれません。ですが、アミボイスの特長でもあります「サクサク感」は、できるだけ維持することを心がけております。

同社には、是非このコンセプトを保っていって欲しいです。

文章の概要を音声でサクサクっと作成し、あとはキーボードでちょこちょこっと修正といった使い方には、抜群の威力を発揮します。

僕がこのブログを運営する上での一番の功労者(ソフト)と言っていいでしょう。

『「AmiVoice」を8年間使用してきて感じた「良かった点」と「悪かった点」』へのコメント

  1. […] サイト:「AmiVoice SP2」を1年間使用してきて感じた「良かった点」と「悪かった点」 […]