返信先: Google音声認識を利用した他のWindows用ソフト

#66365
みち
ゲスト

わいひらさま

ウェブサイトにソフトの愛称を反映させました。

次回のアップデートは10月中を目標にしてますが、最近いろいろ仕事が忙しくてもしかしたら11月に入ってしまうかもしれません。構想はあるのですが、まだ実際にプログラムを試せていません。
遅くなった場合はすみません。

■次に、リアルタイムでのブラウザ外への認識結果の表示は難しいかもしれません。

現在の「音声検出」ダイアログは変換がはじまると表示されて、変換が終わると閉じるダイアログになります。なので「音声検出ダイアログ」が表示されている間は変換中だと思っていただいて構いません
さしあったて次のアップデートで「音声検出」の文字を「変換中」に変更しようと思います。

このソフトの実行ファイル「Speech_Input.exe」はブラウザと通信するローカルサーバーソフトです。
ベクターへのソフト公開前ですが、ChromeとSpeech_Input.exeの通信でちょくちょくエラーが起こる現象が起きていました。はっきりした原因はわかりませんでしたが、短い時間の中で連続で通信しないように制御したところこのエラーが起こらなくなりまた(その辺のトライ&エラーでJavaScriptのソースコードはかなりゴタゴタしました)。
リアルタイムでブラウザ外で認識結果を表示するためには、短時間の間に何度も通信する必要があるのでソフトがちゃんと動くかわかりません。

あと言い訳っぽく聞こえるかもしれませんがGoogleの音声認識は、変換中の文字が確定する時にガラッと変わる事が結構あるので、実装できたとしてもどの確定前の認識結果がどの程度参考になるか疑問があります。

私は変換が上手くいってようがいっていまいが、最後まで話しきってから、誤認識の部分を選択して、再度音声入力で修正しています。

・・・とはいいつつも私も入力先アプリへのリアルタイム表示は気になっている部分でもありますが。

■AmiVoiceのような入力先アプリへのリアルタイムでの表示については、私の知識不足でインターフェースが良くわかりません・・・もう少しWindowsに関する深い知識が必要です。

■半角スペースの除去については、私ももう少しなんとかしたいと思っていました。
APIのオプションはありませんが、検討してみたいと思います。

よろしくお願いします。

NO IMAGE
この記事をお届けした
寝ログの最新ニュース情報を、
いいねしてチェックしよう!