Google音声認識を利用した他のWindows用ソフト

ホーム フォーラム お問い合わせ・ブログや記事に関する質問など Google音声認識を利用した他のWindows用ソフト

100件の投稿を表示中 - 1 - 100件目 (全100件中)
  • 投稿者
    投稿
  • #66171 返信
    みち
    ゲスト

    Voice Codeの記事を読ませていただきました。
    下記URL:
    https://nelog.jp/voice-code

    Google音声認識を利用してWindowsの任意のアプリに直接入力できるソフトもあります。
    レスポンスもよくとても使いやすいです。認識の精度も十分に良いです。

    またうっかり話したひとりごとを入力したくないような状況にも対応できます。

    30日間の試用もできます。もしよろしければ試してみてください。

    ソフト名:話してパソコン入力 via the Web

    ベクターからダウンロードできます。
    https://www.vector.co.jp/soft/winnt/writing/se522161.html

    #66172 返信
    みち
    ゲスト

    すみません。書き忘れてましたが、

    話してパソコン入力 via the Webを使用している時もGoogle Chromeは利用できます。

    音声認識のためのWindowが追加されますがそれだけです。

    句読点に関しては、「。」が句点、「、」は読点で音声入力できます。
    あと「〜です」、「〜ました」などの丁寧語の後に自動で「。」を入力できます。

    #66177 返信
    わいひら
    キーマスター

    「話してパソコン入力 via the Web」というソフトは初めて知りました。
    早速、試用版で使ってみましたが僕の欲しい機能がほぼ詰まっている素晴らしい音声入力ソフトでした。
    本当に精度がいいですね!
    外部アプリへの入力も完璧です。
    少し慣れと調整が必要になるとは思いますが、このソフトを今後主力にしてしばらく使ってみたいと思います。
    良いソフトを教えていただきました。ありがとうございます!

    あと入力がなく20分経つと勝手に音声入力がオフになるのも素晴らしいです。
    これはAmivoice にも欲しいと思っていた機能でついに実現しなかった機能です。

    #66178 返信
    みち
    ゲスト

    わいひらさま
    返信ありがとうございます。

    ソフト気にいっていただけて良かったです。

    実はそのソフトを作ったのは私で、音声入力ソフトを探してるわいひらさまのブログを読んで、ソフトを紹介させて頂きました。

    実際にソフトを使ってみて、気になる点や改善要望がありましたら教えて下さい!
    私のできる範囲でソフトのアップデートの参考にさせていただきたいと思います。もちろん無料です。

    あと偶然ですが、私のウェブサイトはCocoonを使用させていただいてます。
    私はウェブサイトの作成は初心者なので他のテーマと比較してどうのこうのとは言えませんが、初心者の私でも使いやすく、オシャレな素晴らしいテーマだと思います。ありがとうございます!

    #66183 返信
    わいひら
    キーマスター

    作者様だったんですね。
    今回紹介していただいたソフトは、かなり僕の理想に近い音声入力ソフトでした。
    素晴らしいソフトを作っていただきありがとうございます!

    実際にソフトを使ってみて、気になる点や改善要望がありましたら教えて下さい!
    私のできる範囲でソフトのアップデートの参考にさせていただきたいと思います。もちろん無料です。

    さらに良いソフトになればと思ったことを率直に書かせていただければと思います。
    僕は音声認識ソフトの開発はMicrosoft Speech SDK 5.1を利用したお遊び程度のものしか作ったことがないので、的外れなことを書くかもしれませんがご容赦ください。

    1点目は、補正テーブルにデフォルトで「助詞」を「あいうえおの○」みたいに登録できれば便利だなと思いました。
    これはAmiVoice ではデフォルトの機能で、助詞から入力する時結構、誤変換をするので、そんな時にあると便利なので補正テーブルに登録しました。

    2点目は、カッコの扱いは以下のようだとありがたいなと思いました。
    ブログを書いていると結構、普通の括弧を利用するので。

    Google ドキュメントのデフォルトだと「カギ括弧」は変換できますが、(通常の括弧)はひらがなのままでした。
    あと、デフォルトで以下ぐらいのカッコが登録してあると嬉しいです。

    ( )丸カッコ
    「 」鉤括弧(かぎカッコ)
    『 』二重かぎカッコ
    [ ]角カッコ(かくかっこ)
    【 】隅付きカッコ

    https://scarab-v.com/parenthesis/
    上記はブログなどでも結構よく利用するので
    もし可能ならばで良いのですがよろしくお願いいたします。

    #66184 返信
    わいひら
    キーマスター

    あとこれは、ソフトの機能ではないのですがブログで紹介記事を書こうと思って思ったことになります。
    ブログ記事を書こうと思って、まず「話してパソコン入力 via the Web」というのが覚えづらくて入力が大変だなと思いました。
    これが例えば「○○Voice」みたいな一言で言える名前だと、覚えやすいし人に伝えやすいなと思いました。
    ブログや SNS の書き手にとって、長い名前や覚えにくい名前は人に紹介しづらい名前のように感じます(SNS で人に紹介しようと思った時、覚えられない名前だと一旦調べてからコピペなどをする必要があり、これが面倒な場合はブログ・SNS 投稿をやめてしまうケースも考えられます)。
    なので、「話してパソコン入力 via the Web」はサブタイトルみたいにして、何か「一言で言える覚えやすい名前」がついていると、ブログや SNS などでも非常に紹介しやすいなと思いました。

    もちろん、名前を変更するのは大変だと思います。
    名前はそのままだったとしても、何か紹介しやすい愛称みたいなものがあると助かります。

    「このソフトは多くの人に使ってもらいたい」と思うあまり、現時点で思ったことを書いたので、もし、失礼な物言いなどありましたらご容赦願えればと思います。

    いずれにしても、「話してパソコン入力 via the Web」は僕の知る限り現在販売している音声入力ソフトの中では一番のソフトだと思います。ですので、手の不自由な方もそうでない方も、より多くの人に使ってもらいたいと思います。

    #66185 返信
    わいひら
    キーマスター

    Cocoonテーマをご利用いただきありがとうございます!
    「話してパソコン入力 via the Web」のマニュアルを読もうと思った時にCocoonだったので一人で「おおっ!」となっていました(笑)

    #66186 返信
    みち
    ゲスト

    わいひらさま

    早速の返信およびアドバイスありがとうございます。

    補正テーブルのデフォルト設定については、次回のアップデート時に盛り込もうと思います(鉤括弧や「ひらがなのに」などの設定)。

    あと括弧の補正テーブルを設定する時に、ひらがなの場合と漢字の場合を想定して設定しなければいけなかったり、補正テーブルの順番によって補正結果が変わってきたり、という点ももう少しなんとかしようと思います(せめて括弧や括弧閉じなどよく使用する記号だけでもなんとかできればと思います。うまくいかなかったらごめんなさい)。

    次にソフト名ですね。
    これに関しては、最初は私も一言で言えるソフト名にしようと思っていました。実際にいくつか考えてみましたが、既に同じような名前があったりして、色々考えてるうちに商標の問題が気になりだして、絶対に被らない名前で、ソフトの内容が分かる名前にしようと思った結果、現在の名前になってしまったという感じです。

    ただおっしゃる通りソフト名が長いですね。私も自分のウェブサイトでソフト名を書くときに長いなと思いましたが、当初は自分が作ったソフトをブログで紹介しようとしてくれる人がでてくるなんて言うことは考えてもみなかったのでそこまで気にしていませんでした。

    ベクターに登録しているソフト名は後から変更できなかったと思います。
    まずは、次のアップデートで愛称をつけてみようと思います。

    あとまだ予定はありませんが、ソフトの内容を大きく変更するようなことがあればその時は別のソフト・ソフト名でライブラリに登録することも検討してみたいと思います(同一のライセンスで使用できるかたちで)。

    早速のアドバイスありがとうございました。

    #66190 返信
    わいひら
    キーマスター

    補正テーブルのデフォルト設定については、次回のアップデート時に盛り込もうと思います(鉤括弧や「ひらがなのに」などの設定)。

    ありがとうございます!

    あと括弧の補正テーブルを設定する時に、ひらがなの場合と漢字の場合を想定して設定しなければいけなかったり、補正テーブルの順番によって補正結果が変わってきたり、という点ももう少しなんとかしようと思います(せめて括弧や括弧閉じなどよく使用する記号だけでもなんとかできればと思います。うまくいかなかったらごめんなさい)。

    確かにそこは僕も思いました。
    ただ、Googleの音声入力ソフトの場合、それすらできないものが多かったため、補正テーブル機能があるだけでもありがたかったです。

    確かにその点、AmiVoice等の場合は、以下のように「出力したい単語」と「読み仮名」と言ったように一対のみ登録すれば良いので楽ですね。
    これが Google の音声認識の場合可能なのかどうかは僕にはわからないのですが、IME のキーワード登録みたいに手軽にできると誰にでもわかりやすいですね。

    #66191 返信
    みち
    ゲスト

    大変参考になる情報ありがとうございます。

    いろいろ試して、少しでも使いやすくできればと思います。

    ありがとうございました!

    #66192 返信
    わいひら
    キーマスター

    あと一点、質問させてください。
    現在音声入力を始めるには、Chrome を開いて「標準モードで開始」ボタンを押す必要があります。
    これだと、音声入力を開始するには、以下の手順がかかります。

    Chrome をアクティブにする

    タブをアクティブにする(アクティブでないとき)

    音声入力ボタンを押す

    アプリをアクティブにする

    音声入力をする

    なので、タスクバーにソフトのアイコンを表示して、そのアイコンをクリックしたらオン/オフを切り替えられるようにすることは難しいでしょうか。
    やっぱり、Chrome もしくはEdge のタブ中で操作しないとできないような音声認識エンジンの仕様なのでしょうか。

    もし難しいようでしたらスルーしていただければ幸いです。

    #66193 返信
    みち
    ゲスト

    返信ありがとうございます。

    音声認識のオン・オフの切り替えについてですね。

    確かにそこはちょっと面倒くさいですね。

    タスクバーのアイコンからオンオフの切り替えも出来そうな気がします。

    うまくいくかはわかりませんが、試してみようと思います。

    #66194 返信
    わいひら
    キーマスター

    タスクバーのアイコンからオンオフの切り替えも出来そうな気がします。

    もし実装されたら操作手順が結構減ってかなり助かります!

    また、他に何か気づいた事があったらこちらに書いてよろしいでしょうか?

    あと、音声入力ソフトは僕にとってサイト運営の生命線のようなソフトなので、多少なりとも開発支援できればと思いました。
    それで、サイトを見たのですが、寄付・支援に関するページはなかったようです。
    ですので、このフォーラムに書き込まれたみちさんのメールアドレス宛にAmazonギフト券を送ってもよろしいでしょうか。
    もちろん、支援したからといって難しい機能追加を無理強いするつもりも毛頭ありません。
    みちさんは、これまで通りみちさんの判断で自由に開発していただければと思うのですが、いかがでしょうか。

    #66195 返信
    みち
    ゲスト

    わいひらさま

    タスクバーからの音声認識のオンオフの切り替えと補正テーブルのデフォルト設定については、10月中の公開を目標に取り組むつもりです。

    愛称も一応候補は決めました(笑)。

    ソフトに関する問い合わせも当面はこのフォーラムで大丈夫です。公開のめどがたった時は、私もこのフォーラムに投稿します。

    ただやりとりに間隔があいたときはメールで連絡いただければ、私もすぐに内容を確認できますので、そちらの方がスムーズかと思います。

    寄付については、ブログで紹介してくれるだけでも私としてはありがたいですし、そこまでしてくださるとは考えてもいませんでした。

    寄付はありがたく頂きたいと思います。
    フォーラムに投稿したアドレスで大丈夫です!

    #66232 返信
    わいひら
    キーマスター

    メールアドレス宛にAmazonギフト券を送信させていただきました。

    使用していてまた何か思いつきましたら、こちらのフォーラム(トピック)に書き込ませていただきます(こちらだと画像付きで説明できるので)。
    とりあえず急いでいるものではないので、返信はいつになっても大丈夫です。
    加えて、無理だったり難しいものだったらスルーしていただければ幸いです。
    また、こちらに書き込むのも次のバージョンが出るまでにしたいと思います(都度チェックするのも大変だと思うので)。
    次のバージョンが出てからは、何かありましたらメールフォームから連絡させていただきます。

    愛称がサイトなどに反映されたら、ブログ記事も書きたいと思います。

    #66233 返信
    みち
    ゲスト

    わいひらさま

    Amazon のギフト券確かに届きました。
    ありがとうございます。
    ソフトウェア開発に有効活用させていただきます。

    また何かありましたら連絡下さい。

    よろしくお願いします。

    #66362 返信
    わいひら
    キーマスター

    「話してパソコン入力」で、発声をしてから外部アプリに転送するまでの時間、何も出ない時間が結構気になります。
    特に音声変換に長い時間かかると、認識失敗なのか、認識しているけど結果が出ていないだけなのか、結構な時間待つ必要があります。そして認識失敗していると、また同じ時間待つ必要があります。

    Googleに送って戻ってくるまで時間がかかるので、待ち時間はしょうがないと思います。
    そこで、例えばなんですけど、AmiVoiceの場合は対象アプリに対して音声変換中、以下のように変換内容が表示されます。

    もちろん、ここまで詳細な情報は必要ないのですが、対象アプリのカーソル部分に発声した音声だけでも文字として表示することはできないでしょうか。

    Chromeのタブを見たところを、発声した声はGoogleに送信する前に即座に表示はできているみたいなので

    ですので、AmiVoiceのようにアプリのカーソル部分に表示するとまではいかなくても、発声中のダイアログ表示みたいな感じで、音声変換中はその部分に「発声したテキスト(間違っててもよい)」だけでも表示させることはできないでしょうか。

    そのようにすることで、同じ待ち時間であってもストレスが少なくなるように思います。
    ※テキスト表示が無理であれば、ダイアログに変換中みたいなアニメーション等。

    インストールなどをするのに、待ち時間がある場合、プログレスバーがあれば同じ待ち時間でも短く感じるみたいな効果があればと思いました。
    発声から出力まで長いときは10秒くらいかかる時もあるので、以下の待ち時間対策的な効果があるものがあれば幸いです。
    https://www.use-eng.co.jp/appdev/post/765

    #66364 返信
    わいひら
    キーマスター

    あと、半角英数字等に変換された場合、単語の前後に半角スペースがなくすことができるオプションなどをつけることはできますでしょうか。

    もしAPIとかにそういったオプションがあれば変更できるようにしていただけると幸いです。
    APIでできなそうであれば難しそうではありますが^^;

    #66365 返信
    みち
    ゲスト

    わいひらさま

    ウェブサイトにソフトの愛称を反映させました。

    次回のアップデートは10月中を目標にしてますが、最近いろいろ仕事が忙しくてもしかしたら11月に入ってしまうかもしれません。構想はあるのですが、まだ実際にプログラムを試せていません。
    遅くなった場合はすみません。

    ■次に、リアルタイムでのブラウザ外への認識結果の表示は難しいかもしれません。

    現在の「音声検出」ダイアログは変換がはじまると表示されて、変換が終わると閉じるダイアログになります。なので「音声検出ダイアログ」が表示されている間は変換中だと思っていただいて構いません
    さしあったて次のアップデートで「音声検出」の文字を「変換中」に変更しようと思います。

    このソフトの実行ファイル「Speech_Input.exe」はブラウザと通信するローカルサーバーソフトです。
    ベクターへのソフト公開前ですが、ChromeとSpeech_Input.exeの通信でちょくちょくエラーが起こる現象が起きていました。はっきりした原因はわかりませんでしたが、短い時間の中で連続で通信しないように制御したところこのエラーが起こらなくなりまた(その辺のトライ&エラーでJavaScriptのソースコードはかなりゴタゴタしました)。
    リアルタイムでブラウザ外で認識結果を表示するためには、短時間の間に何度も通信する必要があるのでソフトがちゃんと動くかわかりません。

    あと言い訳っぽく聞こえるかもしれませんがGoogleの音声認識は、変換中の文字が確定する時にガラッと変わる事が結構あるので、実装できたとしてもどの確定前の認識結果がどの程度参考になるか疑問があります。

    私は変換が上手くいってようがいっていまいが、最後まで話しきってから、誤認識の部分を選択して、再度音声入力で修正しています。

    ・・・とはいいつつも私も入力先アプリへのリアルタイム表示は気になっている部分でもありますが。

    ■AmiVoiceのような入力先アプリへのリアルタイムでの表示については、私の知識不足でインターフェースが良くわかりません・・・もう少しWindowsに関する深い知識が必要です。

    ■半角スペースの除去については、私ももう少しなんとかしたいと思っていました。
    APIのオプションはありませんが、検討してみたいと思います。

    よろしくお願いします。

    #66396 返信
    みち
    ゲスト

    わいひらさま

    すみません。
    外部アプリへ入力するのタイムラグについてですが、投稿内容の読み間違いをしてました。

    ブラウザに表示されている認識結果はすでにGoogleで変換された結果になります。

    投稿された動画を見ると認識結果が確定したあとにタイムラグが発生していますが、これに関してはブラウザとSpeech_Input.exeの通信と外部アプリへの送信に時間がかかっている事によるタイムラグだと思われます。

    私の端末(2台)では、あまりタイムラグは発生してません。

    もし、カーソルが外部アプリにあっているにもかかわらず、ブラウザの確定した変換結果(赤い文字)が外部アプリに入力されない事があるようでしたら、それはブラウザとSpeech_Input.exeの間で通信エラーが発生してるのだと思います。

    #66397 返信
    みち
    ゲスト

    すみません。

    タイムラグに関しては、どの外部アプリに入力するときも同程度発生すのるでしょうか?

    あと起動しているアプリの数によってタイムラグの増減があるのかなど教えていただけたらありがたいです。

    それと大変申し訳無いのですが、このタイムラグに関しては対策が難しいかもしれません。

    #66400 返信
    わいひら
    キーマスター

    タイムラグに関しては、どの外部アプリに入力するときも同程度発生すのるでしょうか?

    返信が遅くなり申し訳ありません。
    僕の環境だと以前では「音声検出」のダイアログが出てから(長い場合は)5~10秒くらいたってアプリに送信されていました。
    けれど、その後パソコンを再起動することがあったのですがそれ以降はかなり早くなりました。

    僕の試したアプリは、大昔にDelphiで自作したメモ用アプリです。
    https://nelog.jp/wp-content/uploads/2021/09/r-1.gif
    Windows のメモ帳で試したら更に早くなりました。
    https://nelog.jp/wp-content/uploads/2021/09/r1.gif
    もう10年以上前に作った自作のアプリのため、それが原因の可能性も高いかもしれません。
    今度から、メモ帳で書くようにし送信が遅くなったら再起動しようと思います。

    #66401 返信
    わいひら
    キーマスター

    ブラウザに表示されている認識結果はすでにGoogleで変換された結果になります。

    Webを通しているから時間がかかっているのかと思いましたが、だとしたらめちゃくちゃレスポンスが早いんですね。

    これに関してはブラウザとSpeech_Input.exeの通信と外部アプリへの送信に時間がかかっている事によるタイムラグだと思われます。

    アプリへの送信に時間がかかっていたんですね。
    パソコンを再起動してからはめちゃくちゃ早くなりました。
    僕の環境に問題があったようです。失礼いたしました。

    #66402 返信
    わいひら
    キーマスター

    ソフトの愛称は「Sokki Voice」にしました(2021/9/24)。
    https://circle-road.com/

    ソフトの愛称は「Sokki Voice」になったんですね。
    短い上に、ある程度どんなことができるソフトか分かるいい名前ですね。

    次回のアップデートは10月中を目標にしてますが、最近いろいろ仕事が忙しくてもしかしたら11月に入ってしまうかもしれません。構想はあるのですが、まだ実際にプログラムを試せていません。
    遅くなった場合はすみません。

    承知いたしました。
    バージョンアップされましたら、愛称「Sokki Voice」で記事を書こうと思います。

    #66404 返信
    わいひら
    キーマスター

    本日計測してみたところ、アプリによる出力時間の違いはそこまで変わりませんでした。
    どうやら、Windows を長いこと再起動していなかったこと、もしくは「Sokki Voice」を何日間も起動したままにしておいたのが原因だったのかもしれません。

    次に同様の症状になりましたら、まずは「Sokki Voice」を再起動して症状が改善するかを確認し、次に Windows を再起動して確認し、どっちが原因だったのかを特定したいと思います。

    #66405 返信
    みち
    ゲスト

    わいひらさま

    とりあえずはソフトの動作が速くなって良かったです。

    タイムラグが5秒~10秒も発生するという事があるというのは考えてませんでした。
    (私の端末では大体0.02秒くらいの体感できないレベルのタイムラグでした。)

    私も通信が遅くなる原因を調べてみたのですが、今回のケースとは関係ないかもしれませんが、
    セキュリティソフトが通信内容をチェックするために待ちが生じて通信に時間がかかかるという
    ような可能もあるかもしれません。Sokki VoiceはPC内の通信なので、セキュリティソフトがチェックするか
    どうかはわかりませんが。
    その場合は信頼済みのURLに登録するなどすれば良いようです。

    次にアップデートに関してですが、
    ■半角スペースの削除に関して:
    アルファベット間の半角スペースとアルファベットと数字の間の半角スペースは残して、それ以外の半角スペースは削除する事は可能でしたので次回アップデートに含めようと思います。

    ■ブラウザー外からの音声認識オンオフの切り替えについては、
    二つの方法を試してみました。

    ・一つ目は、タスクバーのアイコンを選択して、音声認識オンオフを切り替えるダイアログをクリックして切り替える方法

    ・二つ目は、ディスプレイの下の方(タスクバーの少し上)の邪魔にならない位置に常に最前面に小さいダイアログを表示して、そのダイアログ内にON/OFF切り替えボタンと現在の状態を表示して、音声認識のオンオフを切り替える方法です。

    実際に試してみた感じとしては操作性については二つ目の方が良さそうでした。
    ただこちらに関しては、タイムラグが発生する場合などイレギュラーなケースにどう対応するかなども検討が必要で、少し慎重に進めたいと思いますので、10月のアップデートには含めない可能性が高いです。

    よろしくお願いします。

    #66410 返信
    わいひら
    キーマスター

    体調不良によりサイトはあまり見ておらず、返信が遅れてしまって申しわけありません。

    タイムラグが5秒~10秒も発生するという事があるというのは考えてませんでした。
    (私の端末では大体0.02秒くらいの体感できないレベルのタイムラグでした。)

    僕の環境の場合、電源は常につけっぱなしのため一か月以上も稼働させていたのも良くなかったのかもしれません。
    とりあえず、前回の書き込みから今日までは以前ほどのタイムラグは発生していないようです。

    セキュリティソフトが通信内容をチェックするために待ちが生じて通信に時間がかかかるというような可能もあるかもしれません。

    今のところ使っているセキュリティソフトは Windows デフォルトのものですが、頭の中に入れておきます。

    ■半角スペースの削除に関して:
    アルファベット間の半角スペースとアルファベットと数字の間の半角スペースは残して、それ以外の半角スペースは削除する事は可能でしたので次回アップデートに含めようと思います。

    それは消す作業が省けるのでありがたいです。ありがとうございます

    ・二つ目は、ディスプレイの下の方(タスクバーの少し上)の邪魔にならない位置に常に最前面に小さいダイアログを表示して、そのダイアログ内にON/OFF切り替えボタンと現在の状態を表示して、音声認識のオンオフを切り替える方法です。

    AmiVoice も似たような感じですよね。確かにこちらの方が、ひと手間省けるので楽かもしれませんね。

    ただこちらに関しては、タイムラグが発生する場合などイレギュラーなケースにどう対応するかなども検討が必要で、少し慎重に進めたいと思いますので、10月のアップデートには含めない可能性が高いです。

    承知いたしました。
    アップデートを楽しみにしております!

    #66413 返信
    みち
    ゲスト

    わいひら様

    体調不良によりサイトはあまり見ておらず、返信が遅れてしまって申しわけありません。

    お体は大丈夫ですか?返事はいつでもいいので無理はしないでください。

    次回のアップデートの内容が確定しました。

    ■「」などの記号の入力について
    現在:補正テーブルで設定して入力する形。

    アップデート後:チェックボックスにチェックを入れると、選択している補正テーブルにかかわらずあらかじめ設定してある発音方法で音声入力できるようになります。(ユーザーの設定は不要)
    記号を追加したい場合は補正テーブルから追加することも可能。

    ソフトの画面から入力する記号と発音のリストを確認できるようにします。(「 ⇒ かぎかっこ etc)

    ■補正テーブルの初期設定について
    「なにぬねののの」などを追加します

    ■EXEファイル名とショートカットのリンク名
    今回のアップデートでSpeech_Input.exeをSokkiVoice.exeに変更します。
    ショートカットのリンク名はSokki Voiceに変更します。

    ■半角スペースの処理に対して
    前回の投稿内容の通りです。

    ■音声認識されない空白の時間が発生する問題に対修正
    標準モードで音声認識画面がアクティブではない状態で、音声入力後やく2秒程度音声が認識されない
    時間が発生する問題を修正しました(音声入力後すぐに次の音声認識がされない)。
    一言モードでも音声が認識されない時間が発生しますが0.7秒程度で、実用する上では問題ないレベルでした。一言モードに対しても同様に修正しています。

    ■ブラウザ外からの音声認識のON/OFF切り替えについて
    今回は断念しました。実は画面も作っていたのでできれば取り入れたかったのですが・・・

    ブラウザから一定の時間間隔で繰り返しSpeech_Input.exeに現在のステータスなどを送信して、その応答で音声認識のON/OFFを切り替えようと思っていましたが、音声認識画面がアクティブではない状態が5分続くと、繰り返しの処理が中断されてしまう事が決定的な理由です。(ブラウザの仕様だと思います)。

    ブラウザ外からの音声認識のON/OFF切り替えをするためには、Speech_Input.exe起点でブラウザに情報を送信できるようにしなければならず、こちらに関しては実装方法の調査から始めないとなので、ちょっと時間がかかりそうです。

    ■音声検出ダイアログの文字変更
    「音声検出」⇒「変換中」

    ■補正処理の順番で結果が変わってくる問題に対して
    実際に影響を受ける場合というのは、「」を補正機能で入力するときくらいのような気がするので、
    記号の入力をデフォルト設定にすればほぼ問題ないと思うので、
    補正処理のロジックは現状のままにします。ロジックを複雑にするとユーザーが逆に混乱する場合もあると思いますのでそのままにします。

    返信が大変であれば、返信しなくても大丈夫です。
    お体をお大事にして無理しないください。

    アップデートのタイミングは今月末から来月1週目くらいかなと思います。

    #66414 返信
    みち
    ゲスト

    チェックボックスで利用可能(音声入力可能)な記号ですが、
    今のところ下記の内容を設定しています。
    他に設定しておいて欲しい内容があれば教えていただければ反映します。
    (左が入力内容、右が発音内容)

    。 くてん
    、 とうてん
      ぜんかくすぺーす 全角スペースを入力
    はんかくすぺーす 半角スペースを入力
    「 かぎかっこ
    」 かぎかっことじ
    ( まるかっこ
    ) まるかっことじ
    『 にじゅうかぎかっこ
    』 にじゅうかぎかっことじ
    [ かくかっこ
    ] かくかっこかっことじ
    〈 やまかっこ
    〉 やまかっことじ
    〔 きっこうかっこ
    〕 きっこうかっことじ
    【 すみつきかっこ
    】 すみつきかっことじ
    《 にじゅうやまかっこ
    》 にじゅうやまかっことじ
    { なみかっこ
    } なみかっことじ
    ‘ いんようふ
    ’ いんようふとじる
    “ にじゅういんようふ
    ” にじゅういんようふとじる
    ※ 米印
    ~ チルダ
    ^ キャレット
    ! ビックリマーク
    ! ビックリ、マーク
    $ ドルマーク
    $ ドル、マーク
    % パーセント
    & アンド
    ; セミコロン
    : コロン
    . ピリオド
    ? はてなマーク
    ・ 中黒
    _ アンダーバー
    \ バックスラッシュ
    / スラッシュ
    – ハイフン
    # シャープ
    # 全角#
    # 全角、#
    @ アットマーク
    * アスタリスク
    + プラス
    – マイナス
    = イコール

    #66415 返信
    みち
    ゲスト

    すみません。

    投稿したリストの後半は発音(右がわ)がカタカナだったり記号のままだったりで違っていました。
    実際には発音(右がわ)はソフトではひらがなで表記します。

    #66419 返信
    わいひら
    キーマスター

    日中と夜の気温差で体調は相変わらずでした。最近、日中涼しくなってきたので体は大分楽になりました。一日中涼しいなら涼しいままの方がほんと楽です。。
    ただ、体調にかかわらず書き込みをチェックするのを忘れていました。申しわけないです。

    次のバージョンのSokki Voiceが、より使いやすくなってそうで楽しみです。
    気になった点を何点か質問させてください。

    ■補正テーブルの初期設定について
    「なにぬねののの」などを追加します

    こちら、「ひらがなのの」とかだと何か問題がありましたでしょうか。

    音声認識画面がアクティブではない状態が5分続くと、繰り返しの処理が中断されてしまう事が決定的な理由です。(ブラウザの仕様だと思います)。

    そういう仕様なんですね。残念。
    バックグランドでは常にアクティブにしておいて、GoogleのAPIに「送信する/送信しない」みたいにはできないんですね。
    音声認識アクティブの場合は、発声するとブラウザが即座にAPIを使っちゃうみたいな感じなんでしょうか。

    ‘ いんようふ
    ’ いんようふとじる
    “ にじゅういんようふ
    ” にじゅういんようふとじる

    ここは、カッコみたいに「とじ」だと何か問題がありましたでしょうか。
    カッコと引用符の発生が統一されていた方が覚えやすいかなと思いまして。

    アップデートのタイミングは今月末から来月1週目くらいかなと思います。

    僕は、10月25日から骨の手術のため数週間入院予定なので、バージョンアップ時期がちょうど重なってしまい動作確認をさせていただくとしても、退院後になると思います。
    恐れ入りますがよろしくお願いいたします。

    #66424 返信
    みち
    ゲスト

    わいひらさま

    確かに気温差があると風邪をひいたり体調を調崩しやすいですね。
    布団もかけすぎると暑かったり、かといってかけないと寒かったり厄介ですね。
    僕は新潟に住んでいるのですが、今日は寒い一日でした。

    ■補正テーブルの初期設定について

    こちら、「ひらがなのの」とかだと何か問題がありましたでしょうか。

    すみません。「なにぬねののの」と投稿したのはミスでした。
    ただこちらに関しては、色々と試してみた結果以下のようにしたいと思います。
    ・「何々の」⇒「の」
    ・「何々と」⇒「と」
    ・「何々に」⇒「に」
    上記のように頭に「何々」をつけた時に「何々」を除去して入力するようにすれば、一文字だけ入力する場合も、後に言葉を続けて入力する場合も自然に音声入力できるように思います。

    ※もし今まで使っていた補正テーブルを使用したい場合は、使用したい補正テーブル(旧バージョンの補正テーブル)を名前を変更するなどしてから新しいバージョンの「補正テーブル」フォルダにコピーしてもらえればそのまま使えます。

    ■引用符の音声入力方法について

    ここは、カッコみたいに「とじ」だと何か問題がありましたでしょうか。
    カッコと引用符の発生が統一されていた方が覚えやすいかなと思いまして。

    こちらに関しては、実は最初は僕も「とじ」にしようと思っていたのですが、「いんようふとじ」と発音させて音声認識させてみるとGoogleの音声認識結果は「引用太字」や「24太字」や「引用二次」など意味の通じないような認識結果になって、安定してうまく「’」を音声入力できないかもしれないと思い。
    「いんようふとじる」のようにしました。

    ただ、わいひらさんのおっしゃる通り統一した方が覚えやすいように思いますので、引用符に関しては「いんようふとじ」でも「いんようふとじる」でもどちらでも音声入力できるようにしておこうと思います。

    ■その他記号の音声入力方法について
    一部の記号については前回の投稿した入力方法から若干変更を加えています。
    「プラス」や「マイナス」などはカタカナで入力したい場合もあると思いますので、
    「+」、「-」の入力方法は「ぷらすきごう」や「まいなすきごう」のようにしています。

    また「バックスラッシュ」に関してはSokki Voiceの画面では「¥」と表示されるので、入力方法は「えんきごう」としました。
    他にも文字で入力したい時の妨げにならないように微調整加えています。

    ■ブラウザーの外からの音声認識のオンオフ切替について

    こちらに関しては今回は断念しましたが、いつになるか分かりませんがいつか対応したいと思いますので、気長に待っていただけたらと思います。

    そういう仕様なんですね。残念。
    バックグランドでは常にアクティブにしておいて、GoogleのAPIに「送信する/送信しない」みたいにはできないんですね。

    今回試したのはjavascriptの「setTimeout」や「setInterval」を利用して一定の間隔で音声認識画面からSpeech_Input.exeに通信を試みる方法でした。上記の関数は音声認識画面がアクティブな場合は指定したタイマーで動いてくれますが、アクティブではない場合(他のタブが表示されている場合など)では、どんなに短いタイマーを設定しても1秒に一回以上は動いてくれない等、こちらが意図したとおりに動かないケースがあることが今回分かりました。
    前回の投稿で5分経つと動かなくなると書きましたが、全く動かないわけではなく動く頻度が極端に落ちると言った感じです。そしてまた音声認識画面を表示すると指定したとおりに動き出すといった感じです。

    ※音声認識(音声入力)自体は音声認識画面がアクティブじゃない状態が5分以上続いてもできています。

    音声認識アクティブの場合は、発声するとブラウザが即座にAPIを使っちゃうみたいな感じなんでしょうか。

    Google ChromeとGoogleのサーバーでどのように通信が行われているかまでは情報がないので分かりません。
    ただ推測になりますが、Google Chromeがマイクが検出した「ノイズを含む音」と「人の話した声」を区別しているということは考えにくいので、音声認識中は発声の有無に関わらず、マイクが検出した音(無音時のノイズも含む)を全てGoogleのサーバーに送信しているのではないかと推測します。
    そしてGoogleのサーバーが送られてきた音の中に「人の話した声」が含まれている場合はその声をテキストに変換してGoogle Chromeに送信しているのではないかと思います。

    GoogleのサーバーからGoogle Chromeに音声認識がから送られてくると、そこでイベントが起きるので音声認識画面がアクティブではなくても、音声認識結果をSpeech_Input.exeに送信することができています。

    僕は、10月25日から骨の手術のため数週間入院予定なので、バージョンアップ時期がちょうど重なってしまい動作確認をさせていただくとしても、退院後になると思います。
    恐れ入りますがよろしくお願いいたします。

    そうだったのですね。お体を大事にして無理はなさらないでください。
    また大変参考になる意見を色々とありがとうございます。

    こちらこそよろしくお願いいたします。

    #66425 返信
    わいひら
    キーマスター

    みちさんは、新潟なんですね。
    僕は隣の富山に住んでいます。最近ほんと朝涼しくなりましたね。

    音声認識結果は「引用太字」や「24太字」や「引用二次」など意味の通じないような認識結果になって、安定してうまく「’」を音声入力できないかもしれないと思い。「いんようふとじる」のようにしました。

    なるほど。
    登録しても思い通りにならないやつは稀にありますよね。
    試してはなかったけど、確かに経験的にそのように変換されそうな感じです。
    こればかりはしょうがないですね。

    ■ブラウザーの外からの音声認識のオンオフ切替について

    こちらに関しては今回は断念しましたが、いつになるか分かりませんがいつか対応したいと思いますので、気長に待っていただけたらと思います。

    承知しました。

    ただ推測になりますが、Google Chromeがマイクが検出した「ノイズを含む音」と「人の話した声」を区別しているということは考えにくいので、音声認識中は発声の有無に関わらず、マイクが検出した音(無音時のノイズも含む)を全てGoogleのサーバーに送信しているのではないかと推測します。

    確かに。
    Amazon EchoのAlexaや、Google Homeの音声アシスタントはそんな感じでしたね。
    Alexaとかは、そのように取得した音声データを、社員が聞いていたとか以前記事になっていたような。
    Googleの音声認識APIもGoogle Homeと同じ技術を使ってそうですもんね。

    最近.手術の大量出血に備えて自分の血を貯血したりして、体がだるかったのでそれが体調にも影響しているのかもしれません。
    とはいえあとは、手術するだけです。
    正直、怖くて憂鬱なんですが、多少なりとも今の生活の質(QOL)を向上させるために、行ってこようと思います。
    あー、ほんと嫌だ…^^;

    #66426 返信
    わいひら
    キーマスター

    ※もし今まで使っていた補正テーブルを使用したい場合は、使用したい補正テーブル(旧バージョンの補正テーブル)を名前を変更するなどしてから新しいバージョンの「補正テーブル」フォルダにコピーしてもらえればそのまま使えます。

    これは、Sokki Voiceがバージョンアップして、ソフトをアップデート(インストール)しようとしたときに、毎回「補正テーブル」は上書きされてしまうのでしょうか。

    #66427 返信
    みち
    ゲスト

    わいひらさま

    わいひらさんは富山なんですね、結構近いですね。なんか勝手に親近感が湧いています。
    確かに手術は嫌ですね、手術後もしばらくは痛かったり、安静にしていないとですよね。
    お大事にしてください。

    これは、Sokki Voiceがバージョンアップして、ソフトをアップデート(インストール)しようとしたときに、毎回「補正テーブル」は上書きされてしまうのでしょうか。

    Sokki VoiceはPCにインストールするタイプのアプリではないので、一般的に言われるアップデートというのとは少し違うかもしれません。
    アップデートは新しいバージョンのソフトが入った「Sokki_Voice」フォルダ(現在はSpeech_Inputフォルダ)をユーザーが好きな場所に保存して使用する形になります。

    そのためアップデート後も、旧バージョンのフォルダに入っているSokki Voiceのexeファイルを実行すれば旧バージョンのSokki Voiceを起動できます。
    補正テーブルのファイルはそれぞれのバージョンのフォルダーに入っているため、旧バージョンのソフトを起動すれば旧バージョンで使用していた補正テーブルの設定でソフトが起動します。

    アップデート直後の新しいバージョンのSokki Voiceの補正テーブルの設定内容は、初期設定のままとなっています。
    今まで使っていた補正テーブルを使用するときは、旧バージョンのフォルダの中の補正テーブルのファイルを
    新しいバージョンのフォルダにコピーしていただく必要があります。
    新しいバージョンのフォルダにコピーする際に、コピーするファイルの名前が「一般文書.tsv」や「表またはリスト.tsv」のままだとファイル名が重複していますので、新しいバージョンのデフォルトの設定が上書きされて消えてしまいます。今まで使用していた補正テーブルがそのまま使えればそれで良いと言うのであればファイル名は変更しなくても構いません。

    ・・・・この点についてはどうでしょうか?
    僕はこの部分についてはファイルをコピーするだけなので特にあまり気にしていませんでしたが、改めて今回文章で説明してみると結構面倒くさいような気もします。

    とりあえず今回のアップデートはこのまま行こうと思いますが、次回はもう少し工夫を加えた方がいいのかなと思いました。
    アップデート直後の初回起動時に、「新規利用」と「旧バージョンからのアップデート」なのか確認して旧バージョンからのアップデートの場合は今まで使用していた設定をスムーズに引き継げるように誘導する操作画面にした方が良いのかもしれませんね。

    #66428 返信
    わいひら
    キーマスター

    ・・・・この点についてはどうでしょうか?
    僕はこの部分についてはファイルをコピーするだけなので特にあまり気にしていませんでしたが、改めて今回文章で説明してみると結構面倒くさいような気もします。

    僕の一般的なパソコンソフトのアップデートの動作としては、やっぱりバージョンアップ版のインストーラーを実行したら「フォルダにアップデートファイルが全て上書きされる」という感覚です。

    インストーラーを使わない、今回のSokki Voiceのような解凍して実行するタイプのソフトだったとしても、僕の場合、解凍したフォルダーの中身のファイルを全て選択して、現在のフォルダに上書きしてアップデートしています。そうしないと、余計なフォルダが増えていくので。

    アップデートしたらダメなファイルをわざわざよける必要がある場合は、説明を読まない人が多数なので、上書きしてしまう人も多いのではないかと思います。僕も初めて使ったソフトであれば、説明を読まず普通に上書きしてしまうと思います。
    これまでそのようにして問題があったことがなかったので。

    アップデート直後の初回起動時に、「新規利用」と「旧バージョンからのアップデート」なのか確認して旧バージョンからのアップデートの場合は今まで使用していた設定をスムーズに引き継げるように誘導する操作画面にした方が良いのかもしれませんね。

    何かしら対策は必要かもしれませんね。

    一つの案としては「Sokki Voiceデフォルトの辞書(デフォルト補正テーブル)」と「ユーザーが設定した辞書(ユーザー補正テーブル)」のデータ分けて保存して、実行時に統合して使用するようにするとか。
    そして、ユーザー辞書ファイルは必ず上書きされないようにファイル構成を組む必要があるのかもしれません。
    ユーザー辞書用のファイルは完全に分けてしまって、それ用の上書きアップデートファイルは絶対作らないといった感じです。

    ただそうなると、「Sokki Voiceデフォルトの辞書(デフォルト補正テーブル)」をユーザーが変更してしまった場合、不都合が出てきます(変更されるとアップデートごとに変更チェックをする必要が出てくる)。
    なので、デフォルト辞書はもうデフォルトということで、データを分離してしまって変更できないようにするのも手かもしれません(存在はするけどテーブルに表示しない等)。
    少なくとも、AmiVoiceとかドラゴンスピーチはデフォルトは変更できなかったような気がします。変更する必要もなかったというか。
    最適なデフォルト辞書が作成できれば変更も必要ないように思います。

    ただ、デフォルト辞書が、補正テーブルに表示されなかったとしても、デフォルト辞書がどんな構成になっているのか、これまで通りCSVファイルでどこかに保存されていて見れるようにしてあれば嬉しいです。
    もしくは、サイトにデフォルト辞書の一覧テーブルがあって、そのページへのリンクがあるとか。
    そうすると、「どのようなデフォルト辞書が設定されているのか(音声コマンドが使えるのか)」がわかりやすいですし、「このキーワードはうまく変換されていないようです」みたいなバグフィックスを上げやすいので(どのようなデフォルトがあるのか存在がわからないと、辞書のせいなのか音声入力のせいなのかわかりづらいので)。

    あくまでWindowsプログラムはもう10年近く作っていない者の一案ですので、もっと良い方法をがあればスルーしちゃってください!

    #66429 返信
    みち
    ゲスト

    わいひらさま

    ありがとうございます。
    危うく致命的なミスをするところでした。

    今回のアップデートからユーザーが設定するファイルは配布しないようにします。

    今回のアップデートに取り入れている。「」などの記号の音声入力に関するファイルは、補正テーブルのファイルとは完全に分けていて、補正テーブルには表示せずに別のウィンドウで表示するようにしています(設定の変更も不可)。

    補正のデフォルト設定についても、ユーザーが設定できないが確認は出来て、なおかつファイルは完全に分けておくというようなかたちで行こうと思います。

    適切なアドバイスをありがとうございます。
    本当にたすかりました。

    #66430 返信
    みち
    ゲスト

    わいひらさま

    手術は無事に終了しましたでしょうか。
    経過が順調であることを願っています。

    手術および入院で大変な思いをしているなか大変失礼かと思いますが、
    わいひらさまが入院中にパソコンを操作する事があるのかどうか分からなかったため、
    連絡だけさせていただきます。

    ソフトのアップデートについてですが、先日Vectorに
    Sokki Voice(Ver.2.1.0)の公開の申請をいたしました(現在はまだ未公開)。

    アップデート時に旧バージョンのフォルダを新バージョンのフォルダで上書きした時に、
    使用していたユーザーデータが上書きされてしまう問題について対策していますが、
    Vectorに公開の申請をした後に、まだデータが上書きされてしまう抜け道があることに気がつきましたので連絡しておきます。

    〇OK(ユーザー設定が上書きされないやり方)
    ⇒新バージョンのZIPファイルを展開した後、そのまま「Sokki_Voice」フォルダの中身をコピーして
    旧バージョンのフォルダを上書きする。

    ×NG(ユーザー設定が上書きされて消えてしまうやり方)
    ⇒新バージョンのZIPファイルを展開した後に、新バージョンのSokki Voice.exeを起動してから、新バージョンのフォルダーの中身をコピーして旧バージョンのフォルダを上書きする。
    (Sokki Voiceを起動した時にユーザー設定のファイルがない時に、中身が空のユーザー設定のファイルを作成するため)

    もし不安でしたら、旧バージョンのバックアップを取ってから、新バージョンのフォルダで
    旧バージョンのフォルダを上書きして、問題なかったらバックアップしたフォルダを削除していただけたらと思います。

    お手数おかけいたしますがよろしくお願いいたします。
    この問題については改めて対策を考えたいと思います。

    お体をお大事にしてください。
    失礼いたしました。

    #66472 返信
    わいひら
    キーマスター

    返信が遅くなって申しわけれません。
    手術は無事終了し、術後の通院での傷口検査も問題なかったようです。
    術後、一部問題もありましたが、リハビリで対応することとし、最近ようやく精神的にも落ち着いてきました。
    早速、Sokki Voice2.1.1を使用してみました。
    僕の環境では、設定ファイルが上書きされることはなく問題なくアップデートできました。

    ×NG(ユーザー設定が上書きされて消えてしまうやり方)
    ⇒新バージョンのZIPファイルを展開した後に、新バージョンのSokki Voice.exeを起動してから、新バージョンのフォルダーの中身をコピーして旧バージョンのフォルダを上書きする。
    (Sokki Voiceを起動した時にユーザー設定のファイルがない時に、中身が空のユーザー設定のファイルを作成するため)

    起動した状態で行うと、こればっかりはどうしようもないかもしれませんね。。
    僕だったら、まだユーザーが少ない状態だったら、起動しながらのアップデートは、例外動作ということにしてしまって、そのままで行くかもしれません^^;
    開発初期の仕様変更はどうしようもない部分もあるので。

    まだ、詳細に動作確認はしていませんが、この後実際に文章を書いて使ってみようと思います。
    新しい機能の「記号一覧」や「デフォルト補正の一覧」は、どういう記号等があるのか一目瞭然でカンニングペーパー的に使えてわかりやすいですね。
    また、作者が管理する部分と、ユーザーが管理する部分が明確に分かれて、設定するユーザーの方も、かなり楽になったような気がします。

    #66474 返信
    みち
    ゲスト

    わいひら様

    ご退院おめでとうございます。
    無事に手術が完了したということで安心しております。
    リハビリも今後順調に進むことをお祈りしています。

    前回投稿した、設定ファイルが上書きされる抜け道に対してはVer.2.1.1で対策しています。
    ソフトを起動しただけではユーザー設定用のファイルは作成せずに、新たに設定を追加した時に設定ファイルを作成する形にしました(sokki voiceの操作画面で設定を全て削除した場合はファイルも削除するようにしました)。
    また旧バージョンを利用していたユーザーが、新しいバージョンのソフトを起動した時に所定のフォルダにユーザー設定用のファイルがない場合は、設定ファイルの移行を誘導するダイアログを表示するようにしてます。なのでソフトをアップデートする前に旧バージョンのフォルダを削除しない限りは、Sokki Voiceの誘導に従っていけばスムーズにデータの移行が行えるようになってると思います。

    あと記号の音声入力に関しては、記号によっては強引に変換してるものもあるので、発音の人により個人差などでうまく入力できない時は補正機能利用して入力していただければと思います。

    話は少し変わりますが私のパソコンはWindows 11にバージョンアップしたしました。
    Windows 11ではMicrosoft IMEが新しいバージョンになっていて、その影響でIMEの入力モードが「ひらがな」の時に入力内容のカタカナがひらがなになったり文字の順番が入れ替わってうまく入力できなくなりましたので、現在その対策をしているところです。
    対策版では音声入力前に入力モードを半角英数字に切り替えて入力後に入力モードを元に戻す形にする予定です。こちらのバージョンは12月の前半ぐらいに公開できたらと思っています。
    今のところWindows 10では入力モードを切り替える必要がないので入力モードを切り替えないようにも出来るようにします。

    よろしくお願いします。

    #66475 返信
    わいひら
    キーマスター

    ありがとうございます。

    フォーラムの返信などでいろいろ使ってみました。
    そういえば、半角英数字の左右に余白も入らないようになっていますね。

    IMEといえば、僕の場合IMEが有効になっていない方が使いやすかったりします。
    チェックボックスのオプションとかで、IMEを完全に使用しないモードとかにはできるものでしょうか?
    難しかったら現在のままでも全然良いのですが。

    #66502 返信
    みち
    ゲスト

    わいひらさま

    おはようございます。
    次のバージョンで音声入力前に切り替える「半角英数」は実際にはIMEオフです。

    オプションで音声入力後も「半角英数字(直接入力)」にすることもできます。

    また次のバージョンからは変換中のダイアログのサイズを一回り小さくしています。
    あとオプションで変換中ダイヤログの表示の有無、表示サイズ、表示位置を選択できるようにします。

    上記の内容を盛り込んだ次のバージョンの試作版(Ver.2.2.0P)をオンラインサポートにアップロードしました。

    こちらはWindows 11ユーザーのために、限定的に先行して公開していますのでもし使ってみたいようでしたら、お問い合わせフォームからご連絡ください。ダウンロードに必要なパスワードをメールで送ります。

    正式版の公開はベクターから12月の第2週頃を予定しています。

    よろしくお願いいたします。

    #66504 返信
    わいひら
    キーマスター

    言葉足らずで申しわけないです。

    次のバージョンで音声入力前に切り替える「半角英数」は実際にはIMEオフです。

    オプションで音声入力後も「半角英数字(直接入力)」にすることもできます。

    「半角英数字」に限らず、Sokki Voice使用時には、IMEを完全にオフ(無効)状態にして利用できないものかと思いました(Sokki Voiceでディクテーション時IMEを完全に無効にするオプション)。

    最初、IMEを無効にしてSokki Voiceでディクテーションをするんですけど、途中変換が必要だったとき、IMEを有効にして無効にするのを忘れていると、慌ててIMEを無効にして再度ディクテーションをすると言うことが結構あるので。

    けど、難しいようでしたら現状のままでも大丈夫です。

    #66508 返信
    みち
    ゲスト

    わいひら様

    Sokki Voice使用時には、IMEを完全にオフにすることはできませんが、
    次回のアップデートでディクテーション前にユーザーが手動でIMEをOFFにする
    必要はなくなります。
    音声認識結果を入力先のアプリに入力する前に、Sokki Voiceが自動でIMEをOFFに切り替えます。
    その後、音声認識結果がアプリに入力された後にSokki VoiceがIMEを元の状態に戻します。

    ちなみにわいひら様が使用しているIMEソフトは何になるでしょうか?

    Windows 10であれば、Microsoft IMEを使用すれば、IMEのON/OFFにかかわらず
    音声認識結果はそのまま入力されると思います(IMEに変換されない)。

    #66567 返信
    みち
    ゲスト

    わいひらさま

    Sokki Voiceとは関係ないのですが、

    Cocoonの寄付特典機能というものがあることを知って、利用しようと思ってスマホ(Android)から名前とメールアドレスとカード番号を入力して、「〜円支援する」のボタンをクリックしたのですが、したに「これで特典機能が利用できます」というようなメッセージが表示されてましたが、それ以上先に進まずに、決済も完了してないと思います。

    ボタンのクリックは出来てると思います(アイコンが反応していました)。

    今日は自宅にいないので、パソコンでは試せてません

    僕のスマホがおかしいのかもしれませんが、Cocoonの運営にとって重要なページだと思いますので報告させて頂きました。

    本来なら専用のフォーラムから投稿すべきかと思いますが、いつも投稿しているこちらを利用させて頂きました。

    #66568 返信
    みち
    ゲスト

    わいひらさま

    寄附特典機能の決済できました。
    単にカード確認コード(CVC)が未入力でした。

    大変失礼いたしました。

    #66611 返信
    わいひら
    キーマスター

    返信が遅れて申しわけないです。

    ちなみにわいひら様が使用しているIMEソフトは何になるでしょうか?

    僕が使用しているは、ATOKなので、また仕様が違うのかもしれません。重要な部分なので先にお伝えしとくべきでした。

    前回の返信後にリハビリで車椅子に乗るがてら、Sokki Voiceのレビュー記事を書いていたら長文になってしまい、1週間以上かかってしまいました。
    https://nelog.jp/sokki-voice

    もしかしたら、間違っていたり、現在(v2.2.0)と仕様が違うものになっているかもしれません(書いたのはv2.1.1時点)。
    もし、問題等ありましたら記事内容を修正します。

    #66612 返信
    わいひら
    キーマスター

    Sokki Voice使用時には、IMEを完全にオフにすることはできませんが、次回のアップデートでディクテーション前にユーザーが手動でIMEをOFFにする必要はなくなります。

    あ、次回アップデートでそうなるんですね。
    ちゃんと読めてませんでした。
    楽しみにしています!

    #66646 返信
    みち
    ゲスト

    わいひらさま

    Sokki Voiceのブログを読ませて頂きました。
    非常に丁寧に紹介していただいてありがとうございます。

    ここまで丁寧に紹介していただけるとは思っておりませんでしたので本当に感謝です。
    ありがとうございます。

    一点だけ気になったのは、Sokki Voiceのリンクをクリックしたときに、Vectorのページが表示されるのですが、ベクターのページのタイトルは「話してパソコン入力 via the Web」です。
    なのでお手数ですが、Sokki Voiceの正式名称が「話してパソコン入力 via the Web」だということをどこかしらで説明していただければ幸いです。

    あとブログの記事で、
    「WEBブラウザのWordPressエディターは、カーソルの位置が前後してしまう等の動作はありました。」
    とありましたがおそらくこれはIMEによる影響でIMEがオフであれば上記の現象は起こらないと思いますがいかがでしょうか。

    ■今日IMEの入力モードの自動切替機能が追加されたバージョン(Ver.2.2.1)がベクターから公開されましたので、もし良ければそちらを試してみてください。
    僕はATOKは使ったことがないので、ATOKでの入力モードの切り替えについては確認できておりませんがIMEのオンオフのインターフェースは共通だと思いますのでおそらく切り替わると思います。
    Microsoft IMEとGoogle 日本語入力では動作確認ができています。

    切替方法には二つの切替方法(AとB)があって、「切替方法A」で切り替わらない場合は、「切替方法B」で試してください。
    それでもダメな場合はATOKで入力モードの切り替えをブロックしてるかもしれませんので、入力モードの自動切り替えをブロックするようなオプションがATOKで設定されていないか確認してみてください。

    ■ブラウザーの外からの音声入力のオンオフについて
    こちらについては改良の作業を始めました、今のところは順調で、Sokki Voice.exe起点でブラウザと通信するところまではできました。このまま順調に行けば次回のアップデートでブラザーの外から音声認識のオンオフができるようになりそうです(うまくいかなかったらすみません)。

    #66649 返信
    わいひら
    キーマスター

    一点だけ気になったのは、Sokki Voiceのリンクをクリックしたときに、Vectorのページが表示されるのですが、ベクターのページのタイトルは「話してパソコン入力 via the Web」です。
    なのでお手数ですが、Sokki Voiceの正式名称が「話してパソコン入力 via the Web」だということをどこかしらで説明していただければ幸いです。

    一応、「新たなGoogle音声入力ソフトを知る」項目で名称は書いてあります。
    ダウンロード先でも愛称が書いてあるのでをまぁ、いいのかなと思ったりして。
    それにしても、ベクターのソフト名が変更できないのは不便ですね…。
    一応、最後のリンクにも説明つけておくかな。

    あとブログの記事で、
    「WEBブラウザのWordPressエディターは、カーソルの位置が前後してしまう等の動作はありました。」
    とありましたがおそらくこれはIMEによる影響でIMEがオフであれば上記の現象は起こらないと思いますがいかがでしょうか。

    確認してみました。どうやらそうみたいです。
    IMEを有効にしていたつもりはないのですが、どうやらIMEを無効にしているつもりで使用していたみたいです。
    後で「IMEを使用時」という旨を追記しておきます。

    ■今日IMEの入力モードの自動切替機能が追加されたバージョン(Ver.2.2.1)がベクターから公開されましたので、もし良ければそちらを試してみてください。

    こちらを使えば、上記のような間違いもしづらくなるかも。
    後で使用してみます。

    ■ブラウザーの外からの音声入力のオンオフについて
    こちらについては改良の作業を始めました、今のところは順調で、Sokki Voice.exe起点でブラウザと通信するところまではできました。このまま順調に行けば次回のアップデートでブラザーの外から音声認識のオンオフができるようになりそうです(うまくいかなかったらすみません)。

    おお!すごい朗報!
    仮にうまくいかなかったとしても、全然諦めもつきます。だって、想像するだけでもかなり難しそうなんで…。
    昨日追加された際には記事の内容を修正しておきます。

    #66652 返信
    わいひら
    キーマスター

    最新版を試してみました。
    詳細設定ダイアログの下の説明文に書かれているようにATOKでは「切替方法B」でないとIMEのモードは確かに戻りませんでした。
    でもこれで、WordPressエディターでIMEをオフにし忘れても、カーソル位置がおかしくなってしまう問題は出なくなりました。
    全くIMEを使用したくない場合は「直接入力」にすれば良いので、僕のやりたいモードにもできるようになりました。

    あとひとつ気になったんですが「詳細設定」の「音声入力時の入力モード切替」という設定のキャプションは、Sokki Voice自体の入力モードなのか、IMEの入力モードなのか初めて使った人には分かりづらいかもしれません。
    「音声入力時のIME入力モード切替」等々にキャプションを変更したほうが初見の方にも分かりやすいかもしれません。

    #66654 返信
    わいひら
    キーマスター

    一つ質問です。
    「変換中」ダイアログの文字色が、以前のバージョンでは青色だったのに最新版では赤色になっているのは何か意味があるのでしょうか。

    #66659 返信
    みち
    ゲスト

    わいひらさま

    早速のブログ更新ありがとうございます。

    キャプションの件はIME入力モードに変更します。
    あと一箇所、詳細設定画面の「半角英数」のキャプションを「直接入力」に訂正します。

    変換中ダイアログに関しては、他ユーザーから13インチのノートPCではダイアログが大きすぎるのでオプションにして欲しいと要望があって。

    今回一回り小さくしたのと、テキストのみのダイアログにも出来るようにしました。

    テキストの色は以前は、認識結果を入力する場合はグレーで、入力しない場合は青でした。

    今回フォントのサイズも一回り小さくしたので、グレーでは目立たなすぎるかなと思い、
    音声入力する場合は赤、しない場合は青にしました。

    #66660 返信
    みち
    ゲスト

    わいひらさま

    あと、一つ質問させて頂きたいです。

    今朝ふと気になってあらためて、Google日本語入力で切替方法Bを使用した場合のIMEの入力モードの切り替え確認をしたのですが、「直接入力」の時は問題ないのですが、IMEがONの「半角英数」の時に「ひらがな」に入力モードが戻る不具合を見つけました。
    この件は早急に修正しますが、ATOKではどうでしょうか。

    僕はATOKは使用してないので教えていただけると幸いです。

    よろしくおねがいします。

    #66662 返信
    わいひら
    キーマスター

    そうそう、青は「[ctrl]+[win]で音声入力」を有効にした状態でディクテーションしたときでした。通常時はグレーだった。
    今回急に以前見たことのない赤に変わったので、何か問題があるのかな?と思いました。
    赤はエラー的な意味合いもあるので正常動作時は黒とかグレー、もしくはグリーン(正常色)とかでもいいのかもしれません。正常動作している時は目立つ必要もないような気もしますし。

    ここら辺のやつです。
    https://uxmilk.jp/78670
    https://qiita.com/kaizen_nagoya/items/cb7eb3199b0b98904a35

    ただ、初見から赤で利用してきた人には特に違和感はないのかもしれません。僕はWeb制作をしているので必要以上にそう思ってしまうというのもあるのかもしれません。

    #66663 返信
    わいひら
    キーマスター

    >今朝ふと気になってあらためて、Google日本語入力で切替方法Bを使用した場合のIMEの入力モードの切り替え確認をしたのですが、「直接入力」の時は問題ないのですが、IMEがONの「半角英数」の時に「ひらがな」に入力モードが戻る不具合を見つけました。

    僕の環境でも同様の動作になるようです。

    #66664 返信
    わいひら
    キーマスター

    あと今回、IMEモードが以前のデフォルトだった「入力モードを切り替えない」から変わった時に思ったんですが、
    以前は、IME変換を利用しようと思うと「IMEの変換」ボタンを押せば利用できました(この仕様がIMEの状態を把握するのが大変だったので、現在の仕様になって使いやすいです)。
    ただ現在の仕様では、まれに「IMEで文字変換」をしたい場合は、「詳細設定」から「音声入力時の(IME)入力モードの切り替え」から「入力モードを切り替えない」を選択してからディクテーションをする必要があります。

    これを、例えばShiftキーを押しながらディクテーションした場合には、「音声入力時の(IME)入力モードの切り替え」が「入力モードを切り替えない(もしくはIME ONの状態)」で変換能力が有効なまま音声入力できるよう機能追加することは可能でしょうか。
    こうすると、「IMEで文字を再変換したい」なんて場合にも手軽に使えると思いました。

    あくまでふと思ったことを書いただけなので、他のモードとの兼ね合いもあると思うので採用していただかなくても全然問題ないです。
    間違いなく今回のモード追加でより使いやすくなったので。

    #66666 返信
    みち
    ゲスト

    わいひらさま

    変換中のダイアログのフォントの色に、アドバイスありがとうございます。

    この点はもうちょっと検討してみます。
    赤のフォントと青のマイクのがいまいち合ってないような気がしてて。いずれ何かしら変更すると思います。

    あと、通常音声入力で使用している時は確かにそんなに目立つ必要は無いんですが、逆に音声入力するつもり無い時に他の人の声をひろった場合とか、うっかり独り言を言ってしまった時とかはある程度目立ったほうがいいように思います。

    Googleドキュメントのマイクは音声認識中は赤だったり、ブラウザ上部に赤マルがついたりしてます。
    あとweb speech apiのドキュメントには音声認識中であることをユーザーに分かりやすく知らせるように、というようなことも書いてあったと思います(セキュリティ的なだと思いますが)。

    ■shift押しながらディクテーションだIMEをONにする件は了解しました。

    前回投稿した内容の修正と合わせて、来週もしくは再来週公開できたらと思います。

    ただ、Sokki VoiceでのIMEオンでの再変換はATOK以外では使えないと思います。
    というのも、Google日本語入力では漢字は再変換の対象にならなかったり、Microsoft IMEでも漢字が再変換の対象にならなかったりします。Windows11のMicrosoft IMEでは文字の、順番が入れ替わったりと論外です。(以前のバージョンのMicrosoft IMEをオンにすれば、漢字も再変換の対象になるようですが。)

    ATOKユーザーにとっては便利だと思うので機能追加します。

    よろしくおねがいします。

    #66667 返信
    わいひら
    キーマスター

    あと、通常音声入力で使用している時は確かにそんなに目立つ必要は無いんですが、逆に音声入力するつもり無い時に他の人の声をひろった場合とか、うっかり独り言を言ってしまった時とかはある程度目立ったほうがいいように思います。

    ダイアログが出るだけでも十分目立つような気もします。あまりダイアログが出るソフトもないので。
    僕だと他人が入ってきたとき時、音声入力を有効にしていると大惨事になるので、真っ先に音声認識をオフにしてしまいますね…(他人がいるときも誤入力リスクが高いのでそもそもONにしないかも)。
    あと、ディクテーションをしている最中に独り言を言うこともこれまで音声入力を使用して何年にもなりますが一度もないような気もします。誤入力してしまうので。
    他人がいるときも、独り言を言うときも、誤入力が必至なので、音声入力を使えば使うほどそういうことはないような気もします。
    あっても、使い始めの最初の2、3回ぐらいのような気がします。

    Googleドキュメントのマイクは音声認識中は赤だったり、ブラウザ上部に赤マルがついたりしてます。

    これは確かに、Google音声認識が有効な時は赤は赤です。
    それは、AmiVoiceも音声認識が有効な時は赤で知らせます。
    なので仮に、Chromeの外部から音声認識のON/OFFが変更可能になったら、その際の切り替え表示は赤でわかりやすいと思います。
    ただ僕の環境のGoogleドキュメントで確認してみても、少なくとも「変換中」のときに赤が出ているわけではないと思います(変換中は赤色アイコンの周りに黒い輪が出るだけ)。
    それに赤色になっているのは文字ではなくアイコンです。
    やはり文字が赤になっているのはは、あまり良い印象は受けないです。
    とはいえ先日も書きましたが、これに関しては完全に個々の感覚的なものなのでお任せいたします。

    ただ、Sokki VoiceでのIMEオンでの再変換はATOK以外では使えないと思います。

    そうなんですね。ATOK以外は全て消してしまって使わないので知りませんでした…。
    他のIMEも標準で同じ動作かと思ってました。
    明日にでも記事の方に追記しておきます。

    #66668 返信
    みち
    ゲスト

    わいひらさま

    文字の色はいい機会なので、全体的に見直そうと思います。
    変換中の色は黒あたりで良さそうですね。
    音声認識画面の確定した認識結果も赤から青あたりに変更しようかと思います(さすがに、認識結果をリンクと間違えない気もしますし)。

    アドバイスありがとうございます。

    あと聞こうと思いながら、いつも忘れてたのですが、Ami VoiceはIMEのオン/オフの違いで、入力のされ方に違いはありますか?

    あと一つ教えて頂きたいのですが、再変換をしたいと思うケースはどんな時ですか?

    今後、Sokki Voice独自の再変換機能も追加していけたらと思っていたので教えていただけるとありがたいです(ブラウザ外からの音声認識オン・オフ機能追加の後ですが)。

    基本的には、ある程度長い認識結果はAIに任せて、
    単語や短い言葉に対して、再変換候補があればリストから選択出来るようにするという方向で考えてます。

    #66670 返信
    わいひら
    キーマスター

    あと聞こうと思いながら、いつも忘れてたのですが、Ami VoiceはIMEのオン/オフの違いで、入力のされ方に違いはありますか?

    AmiVoiceは、IMEによる入力の違いはないです。
    というよりも、AmiVoiceは一切IME機能を利用していないように見えます。
    利用せずともAmiVoice自体に変換機能がある感じです。

    あと一つ教えて頂きたいのですが、再変換をしたいと思うケースはどんな時ですか?

    これは、同音異義語がたくさんあって何度ディクテーションしても思うような文字列が表示されない時ですね。
    そういう時は、通常ならばキーボード入力すれば良いのでしょうが、僕のようなキーボード苦手勢は、キーボードを打つのがしんどいので、音声入力ができるものであれば頼りたくなってしまいます。

    今後、Sokki Voice独自の再変換機能も追加していけたらと思っていたので教えていただけるとありがたいです(ブラウザ外からの音声認識オン・オフ機能追加の後ですが)。

    まじですか…。そんな機能が追加された暁には、Sokki Voice無敵ですね…。

    単語や短い言葉に対して、再変換候補があればリストから選択出来るようにするという方向で考えてます。

    僕が再変換するときも、そんな感じで使っています。

    #66672 返信
    わいひら
    キーマスター

    AmiVoiceの変換機能はこんな感じです。

    基本的にはATOKのようなIMEと似たような使い方です。

    ただ、IMEと違ってAmiVoiceは変換する文節を変更することはできないぽいです(僕がやり方を知らないだけかも)。
    具体的にGIF画像内では、「彼」で変換候補が出ていますが「彼と」を変換候補に変更することはできないっぽいです。
    あと、IMEだと使用頻度の高い変換候補は上位に入れ替わりますが、AmiVoiceの変換機能今そういった機能はないっぽいです。

    • この返信は1ヶ月、 1週前にわいひらが編集しました。
    #66674 返信
    みち
    ゲスト

    わいひらさま

    ありがとうございます。

    AmiVoiceが変換してる様子は、確かにIMEが変換している時と似ていますね。
    AmiVoiceは初めから確定した認識結果をアプリケーションに入力することもできるんでしょうか?
    それとも必ずEnterキーを押すなどしてユーザーが入力する内容を確定しなければいけないんでしょうか。

    ■シフトキーを押しながら音声入力でIMEをオンにする件
    先日ベクターにSokki VoiceのVer.2.2.2の公開の申請依頼をしました。Vectorでは水曜日の夕方頃にソフトが公開されることが多くなっておりますのでチェックしてみてください。場合によっては次の週になるかもしれません。

    今回の変更点は、
    〇シフトキーを押しながら音声入力した時はIMEがONの状態で音声入力できる機能の追加。
    詳細設定画面のチェックボックスにチェックを入れると使用できるようになります。

    〇前に投稿した「IMEの入力モード切替方法B」における不具合修正

    〇ダイアログなどの文字の色の変更
    変換中ダイアログの文字の色は、以前のグレーに戻しました(一番しっくりくるため)。

    〇キャプションの訂正
    「入力モード切替」⇒「IME入力モード切替」など

    以上が今回の変更内容になります。

    よろしくお願いします。

    #66675 返信
    わいひら
    キーマスター

    AmiVoiceは初めから確定した認識結果をアプリケーションに入力することもできるんでしょうか?
    それとも必ずEnterキーを押すなどしてユーザーが入力する内容を確定しなければいけないんでしょうか。

    AmiVoiceは、確定した認識結果(変換結果)は、基本エンターキーを押さないと確定されません。
    とはいえ、確定せずに次の音声入力を開始すると、前回の音声入力が確定されるので、キーボード操作は変換操作をする時くらいしか必要ない感じです。

    ■シフトキーを押しながら音声入力でIMEをオンにする件
    先日ベクターにSokki VoiceのVer.2.2.2の公開の申請依頼をしました。Vectorでは水曜日の夕方頃にソフトが公開されることが多くなっておりますのでチェックしてみてください。場合によっては次の週になるかもしれません。

    これは、マジでありがたいです。
    公開されたら早速使ってみます。
    僕も以前ベクターを利用したことがあるのですが、相変わらずアップするのに時間がかかるんですね…。
    めっちゃすぐ使いたい(笑)

    #66676 返信
    わいひら
    キーマスター

    一応、ダウンロード用リンクも設置。
    https://www.vector.co.jp/soft/winnt/writing/se522161.html

    #66679 返信
    わいひら
    キーマスター

    先日、プラグインアップデートしたら、何かが競合したのかbbPressフォーラムの装飾ツールバーが表示されなくなってしまったので、別のツールバーを使えるようにしておきました。

    加えて、画像のアップロードも手軽にできるようにしておきました。

    後は、一つのトピックにつき返信を100まで表示されるように変更しました。

    • この返信は1ヶ月前にわいひらが編集しました。
    #66681 返信
    みち
    ゲスト

    わいひらさま

    大変参考になる情報ありがとうございます。

    以前ダブルクォーテーションを使おうと思った時に装飾ツールバーがなかったので「あれっ」と思ってました。僕の端末がおかしいのかなと思ったのですがそういうことだったのですね。

    画像のアップロードツールも今度使わせてもらおうと思います。

    よろしくお願いします。

     

    #66682 返信
    わいひら
    キーマスター

    動作確認してみました。

    〇シフトキーを押しながら音声入力した時はIMEがONの状態で音声入力できる機能の追加。

    IMEモードAでもBでも、Shiftキーを押すとIMEがオンの状態で動作しました。

    〇前に投稿した「IMEの入力モード切替方法B」における不具合修正

    これは僕の環境(ATOK)だけかもしれませんが、半角英数字には戻りませんでした。

    とはいえ、IME半角英数字モードを使うことはないので、あまり気にはなってません。

    〇ダイアログなどの文字の色の変更
    変換中ダイアログの文字の色は、以前のグレーに戻しました(一番しっくりくるため)。

    僕もしっくりきました。

    〇キャプションの訂正
    「入力モード切替」⇒「IME入力モード切替」など

    ありがとうございます。
    確認いたしました。わかりやすくなりました。

    #66684 返信
    みち
    ゲスト

    わいひら様

    これは僕の環境(ATOK)だけかもしれませんが、半角英数字には戻りませんでした。

    IMEの入力モードに関しては、使用するIMEソフトによってソフトの動きが変わってくるのかもしれません。

    (一応僕も改めて再度動作を確認してみましたがGoogle 日本語入力ではIMEがONの半角英数字に戻りました。)

    Microsoft IMEの場合はIMEがONの「半角英数字」自体がなかったりしますし、IME がONの「半角英数字」は少し特殊なのかもしれません。

    ATOKでIMEがオンの「半角英数字」が元に戻らない件については、オンラインサポートで説明を追加しておきます。

    #66687 返信
    みち
    ゲスト

    わいひらさま

    僕はATOK使ってないので教えて頂きたいのですが、

    ATOKの切替方法Bで、カタカナ、半角カタカナ、全角英数字の場合は音声入力後に元のモードに戻りますでしょうか?

    #66724 返信
    わいひら
    キーマスター

    ATOKにて以下の全部で試してみましたが全て元の「ひらがな」に戻りました。

    IMEはそれぞれ独特の仕様があると思うのでどうしようもないのかもしれませんね。

    #66725 返信
    みち
    ゲスト

    わいひらさま
    <p style=”text-align: left;”>もしかすると、カナロックの影響じゃないでしょうか。</p>
    お手数おかけしますが、一度カナロックを解除して試してもらうことは可能でしょうか?

    よろしくおねがいします。

    #66726 返信
    みち
    ゲスト

    わいひら様

    ATOKでの動作に関して気になったので、体験版をダウンロードして色々試してみました。

    Microsoft IMEやGoogle 日本語入力では入力モードを指定した後にIMEをオンにすることでも入力モードを切り替えることができましたが、ATOKではそうではなかったようです。

    ATOKではIMEの入力モードをひらがな以外にするには、IMEをオンにした後に入力モードを指定する必要があったようです。

    そうすることで、IMEの切替方法Bでカタカナ、半角カタカナ、全角英数、半角英数に戻すことができました。

    この点については来月中旬から下旬のアップデートで対応しようと思います。

    よろしくお願いします。

     

     

    #66727 返信
    わいひら
    キーマスター

    一応報告。
    カナロックになっていたのは、スクリーンショットを撮影するのにたまたまなっただけだと思います。
    ATOKバーはカーソルが外れてしまうと消えてしまうので撮影自体が難しかったので、色々触っているうちに^^;
    スクショ撮影前は、そのまま行いました。

    この点については来月中旬から下旬のアップデートで対応しようと思います。

    仕様自体が違ったんですね。
    外部からのオン/オフ共々、楽しみにしております!

    #66886 返信
    みち
    ゲスト

    わいひら様

    あけましておめでとうございます。今年もよろしくお願いいたします。

    ブラウザの外からの音声認識のオンオフの機能を追加したバージョンの試作版を

    私のウェブサイトで限定的に公開しました。

    ソフト&アプリ工房 サークルロード | Welcome (circle-road.com)

    先行して試作版を限定公開したのには、情報収集などの試験的な意味合いもあるため、ダウンロードするのにパスワードをつけています。

    もし利用して頂けるようでしたら、大変お手数ですが私のWebサイトの問い合わせフォームより連絡いただければパスワードをメールで送付いたします。

    僕が一番知りたいのは、
    今回ブラウザーの外から音声認識のオンオフを切り替えるために、Web Socketという通信プロトコルを使ってSokki Voice.exeと音声認識画面を常時接続してるのですが、稀に接続が途切れることがあります(その場合は音声認識画面で音声認識を開始すると再接続します)。
    僕の環境では接続が途切れることはほとんどないので、あまり気にならないレベルなのですが、他のパソコンでどうなのかちょっと気になっています。

    いずれにせよ、正式版は今月の下旬頃には公開したいと思っていますので、正式版からの利用でも全然構いません。

    連絡だけさせていただきました。

     

    #66888 返信
    わいひら
    キーマスター

    ご連絡ありがとうございます!
    ついにその機能が追加されたのですね。
    是非ダウンロードして、テストに参加させていただければと思います。
    後で、サイトからメールを出しますね。

    #66945 返信
    わいひら
    キーマスター

    ダウンロードしてここ数日使ってみました。

    「稀に接続が途切れる」とのことですが、僕が使用している限りでは接続が切れることはありませんでした。
    僕の場合、こまめにオン/オフするので、途切れるほど長時間オンにしていなかったというのもあるのかもしれません。
    僕が利用している場合は、オンにしている時間は最長でも2時間ぐらいにしかなりません。

    あと、新しい接続昨日ですが、以前全てのウィンドウを最小化している時は、

    1. Chromeを前面に出す
    2. タブをアクティブにする
    3. 音声認識を有効にする

    といった手順が必要だったのが、

    1. 接続ウィンドウをアクティブにする
    2. 音声認識を有効にする

    と、ひと手間減ったのでかなり楽になりました。

    以下、使用して思ったことを率直に書くのでご容赦ください。
    今回のアップデートで接続の切り替えの作業はだいぶ楽になりましたが、できればタスクでワンアクションでオン/オフを切り替えられるように機能追加するのは難しいでしょうか。
    タスクボタン形式で接続を切り替える場合は、モードが選択できないので、予めモードをオプション等で設定できるようにする等、必要があるのかもしれませんが…。

    難しいようでしたら、もう少しウィンドウを小さくして、常に最前面に表示されるようにして頂けると嬉しいです。
    そうすると、ほぼワンアクションで接続を切り替えられるようになるので。
    現在の接続ウィンドウは、縦横にそれなりに大きくてウィンドウの隙間に入れるには、ちょっと大きすぎる感じです(あくまで僕の環境ではですが)。
    AmiVoiceはこんな感じで、長細くなっていて、ウィンドウの隙間に入れやすくなっています。

    もしくは、接続ウィンドウのモード選択をなくして「接続」だけにして、トグルボタン形式でオンオフを切り替える(オンの時はマイクを赤くするなど)とかにしても、省スペースにできるかもしれません。

    #66946 返信
    わいひら
    キーマスター

    僕は常に「一言モード」しか使わないのですが、みちさんとか他のユーザーさんとかは、ケースバイケースでモード切替をして利用されているのでしょうか。
    僕の場合自分に合ったモードは、「一言モード」で、それしか使わないのでモード選択はオプションでも良いのかなと思いました。
    ※「モードをこまめに切り替え派」が多い場合は、今回書いたのはあまり意味の無い提案かもです。

    #66947 返信
    わいひら
    キーマスター

    あと、Sokki Voiceとは関係ないのですが質問です。
    作成されている言語は何でしょうか。Visual Basic?

    #66948 返信
    わいひら
    キーマスター

    あと一点、Sokki Voiceをアップデートするたびに毎回、ショートカット作成ダイアログが表示されるのですが、これを初回だ気にすることは難しいでしょうか。
    これは特に、不便というわけではないのですが、毎回アップデートするたびにショートカット作成が促されるので、ちょっと気になりました。

    すいません。メールで返信しても良かったんですが画像を貼り付けて説明でき、簡単なHTMLも手軽に使えるのでこちらで返信させて頂きました。

    とりあえず、ここまで書くのに30分ぐらいかかりましたが、やっぱり接続が切れることはないですね。
    僕の環境に関して言えば、接続関係は全く問題ないです。

    #66982 返信
    みち
    ゲスト

    わいひらさま

    試作版のご利用ありがとうございます。

    とても貴重なアドバイスありがとうございます。

    ここまで書くのに30分ぐらいかかりましたが、やっぱり接続が切れることはないですね。
    僕の環境に関して言えば、接続関係は全く問題ないです。

    とりあえず問題なく接続状態が維持されるということで、僕が一番懸念していた点がクリアできていてよかったです。

    音声入力している最中に関しては、万が一接続が途切れたとしても音声認識画面内部のjavascriptが動いており再接続をする処理が機能するはずなので、接続が途切れたままになることはないはずです。

    接続が途切れる可能性があるのは音声認識をオフの状態ですが、仮にそうなったとしても今まで通りの方法で1回音声認識を開始すれば、また接続状態が維持されるはずです。

    できればタスクでワンアクションでオン/オフを切り替えられるように機能追加するのは難しいでしょうか。

    タスクトレイの件とウィンドウサイズの件了解しました。

    上記の2件実装できましたので、動作確認が出来次第またサーバーにアップロードします。また同じパスワードでダウンロードできるようにしますので試していただけたらと思います。早ければ明日アップロードします。

    ショートカットの件も了解しました。合わせて修正します。

    Sokki Voiceとは関係ないのですが質問です。
    作成されている言語は何でしょうか。Visual Basic?

    僕はC#(.NET Framework と Win32 API)で作成しています(音声認識画面はJavaScript)

    Visual BasicでもC#と大体同じことができそうですね。

    以上よろしくお願いします。

    #66983 返信
    わいひら
    キーマスター

    接続が途切れる可能性があるのは音声認識をオフの状態ですが、仮にそうなったとしても今まで通りの方法で1回音声認識を開始すれば、また接続状態が維持されるはずです。

    接続に関しては、最新版を使い始めて今まで全く違和感は感じないです。

    タスクトレイの件とウィンドウサイズの件了解しました。
    上記の2件実装できましたので、動作確認が出来次第またサーバーにアップロードします。

    まじですか。実際いただきありがとうございます。
    ダウンロードできるようになったら試してみます。めちゃくちゃ楽しみです。
    この機能が付いたらAmiVoiceからSokki Voiceに完全移行できそうです(現在も6:4で使用しています)。

    僕はC#(.NET Framework と Win32 API)で作成しています(音声認識画面はJavaScript)

    C#なんですね、フォームの大きさを小さくした時にスクロールバーが出る感じとか、VBもそんな感じだったのでそう思ってしまいました。

    C#もそうなんですね。教えて頂きありがとうございます。

    #66984 返信
    わいひら
    キーマスター

    上記の2件実装できましたので、動作確認が出来次第またサーバーにアップロードします。

    こちらが実装できましたら、手間がなくなるので必要なくなるかもしれませんが、可能であれば音声認識オン/オフのホットキーをユーザーが任意に設定できるようにしていただくことはできますでしょうか。

    僕は手が不自由なので、ShiftやCtrlやWinキーは、「コンピューターの簡単操作」の「キーボード操作の変更」から固定キー機能を利用しているのですが、その機能とバッティングしてしまって。

    ※画像はWindows 8のものです

    全部変更できずともWinキーだけでも出来れば変更したいです。
    固定キー機能とバッティングしたとしても動作するにはするのですが、どうもWinキーだけは僕の使用しているソフトキーボードでマクロに登録できなくて…。

    マクロに登録できるとマウスキーボードでもワンアクションで音声認識オン/オフを切り替えられるようになります。

    とはいえ、Sokki Voiceにタスクボタン機能が追加されたら、必要度はそこまで高くなくなります。
    実装が難しくないようであればで良いので、ご検討いただければ幸いです。

    • この返信は1週、 3日前にわいひらが編集しました。
    #66987 返信
    みち
    ゲスト

    わいひらさま

    タスクトレイからの音声認識オンオフなどの機能を盛り込んだバージョンのSokki Voiceをサーバーにアップロードしました(Ver.3.0.0C)。

    前回と同じページからダウンロードすることができます(パスワードも同じ)。操作方法に関してはオンラインマニュアルに記載していますのでそちらを参照していただければと思います。

    音声認識オン/オフのホットキーをユーザーが任意に設定できるようにしていただくことはできますでしょうか。

    ホットキーを任意のキーにすることに関してはまた改めて検討させてください。
    とりあえず今回のアップデートに関してはここまでの範囲でいきたいと思います。

    その次のアップデートで対応できればと思います。

    よろしくお願いします。

    #66988 返信
    わいひら
    キーマスター

    早速最新版を利用させて頂きました。
    音声認識オン/オフウィンドウの大きさも僕にとっては完璧です!
    ブラウザ等の以下のような隙間にスッキリと配置できて、見やすいですし全く邪魔にもなりません。

    あと、ウィンドウも常に最前面になっているので、「全てのウィンドウを縮小化」をしてもウィンドウが隠れることはなく、改めてウインドウを再表示する必要もなくなりました。
    これでかなりのマウスアクションを節約することができます。

    加えて、タスクボタンのオン/オフ機能が便利すぎます。
    タスク機能があれば「音声認識オン/オフウィンドウ」を表示させなくても、オン/オフを切り替えられますし、何より状態も一目瞭然です。

    これで、音声認識のオン/オフでAmiVoiceに負けないくらいの操作性になりました。
    これからはSokki Voiceを完全にメインソフトとして利用させて頂きます。

    あと、「アップデートした際にショートカット作成画面が出る」についても今回のアップデートで改善されていました。
    ありがとうございます。

    #66989 返信
    わいひら
    キーマスター

    ホットキーを任意のキーにすることに関してはまた改めて検討させてください。
    とりあえず今回のアップデートに関してはここまでの範囲でいきたいと思います。

    承知いたしました。
    ただ今回のオンオフウィンドウのアップデートで、音声認識オン/オフに関しては、ホットキーを利用した時と同様の操作性を得ることができました。
    ですので、ホットキー変更機能がなかったとしても、十分操作性がよく満足しています。
    ホットキーを使わなかったとしてもかなり使いやすくなりました。

    今回のアップデートの正式版が出た際には、Sokki Voice記事の方も加筆修正しておきます。

    #66990 返信
    みち
    ゲスト

    わいひらさま

    今回の改善内容に満足して頂けて良かったです。

    音声認識オンオフのショートカットキーに関して
    他にもうまく利用できないユーザーがいましたので、選択肢を一つ増やそうかなと思っているのですが、
    Ctrl+CapsLockあたりだとどうでしょうか?

    理想は任意のキーの割り当てが出来れば良いのですが、
    それをやろうとするとそれだけで結構時間がかかってしまいそうなので、
    さしあたってもう一つくらい選択肢を増やそうかなと思っています。

    もし他にいいキーの割り当てがありましたら教えていただければ幸いです。

     

    #66991 返信
    わいひら
    キーマスター

    ほんと今回神アップデートでした。

    Ctrl+CapsLockあたりだとどうでしょうか?

    調べてみた限り僕の使用しているマウスキーボードでは登録できるようです。
    http://ww3.tiki.ne.jp/~k_nakada/tsk/macro.html
    ただし、こればっかりは実際に試してみないと分からないです。CapsLockなどこちらもロック系のキーボードなのでダメな可能性もあるかもしれません。

    理想は任意のキーの割り当てが出来れば良いのですが、
    それをやろうとするとそれだけで結構時間がかかってしまいそうなので、
    さしあたってもう一つくらい選択肢を増やそうかなと思っています。

    今回の改善でオンオフアクションの改善がかなりなされたので無理して実装することもないように思います。

    もし他にいいキーの割り当てがありましたら教えていただければ幸いです。

    僕の場合は以下のようなホットキーがあると嬉しいです。

    ・Ctrl+Shift+半角英字
    ・Ctrl+Shift+ファンクションキー(F1~F12)

    #66992 返信
    わいひら
    キーマスター

    あとひとつ、これは不具合か正しい動作かわからないので質問です。
    補正テーブルなどで「改行コード追加」ボタンを押すと以下のようなテキストが入るかと思います。

    {改行コード}

    こちらは、次の行に移動するようにキーボードエミュレートがされると言うことでよろしいでしょうか。
    僕も、次の行に移動するのに利用するため、改行させたいのですが、この{改行コード}コマンドを利用しても次の行に改行されないです。

    #66993 返信
    わいひら
    キーマスター

    キーボードエミュレートとしては、画像の矢印は正常に動作しているようなんですが、{改行コード}はうまく動作しません。

    #66994 返信
    みち
    ゲスト

    <p style=”text-align: left;”>わいひらさま</p>
    ホットキーについての提案ありがとうございます。

    検討させて頂きます。

    {改行コード}に関しては、改行コードをエミュレートしてます。ただ入力先のアプリケーション(ワードプレス等)によっては改行されません。メモ帳など改行出来るアプリもあります。

    最初のバージョンではエンターキーをエミュレートするようにしていたのですが、エンターキーの場合は改行以外にもいろんな役割をはたして思わぬ誤動作につながる可能性もあったためやめました。

     

     

    #66995 返信
    わいひら
    キーマスター

    {改行コード}に関しては、改行コードをエミュレートしてます。ただ入力先のアプリケーション(ワードプレス等)によっては改行されません。メモ帳など改行出来るアプリもあります。

    確かに。
    メモ帳だとなりますね。アプリとの相性なんですね。

    ちなみに、入力後には矢印のエミュレートコードみたいなのはありますが、

    任意に設定できる{改行コード}ならぬ{↑}{↓}{←}{→}みたいなやつはないのでしょうか。

    その意図としては「」を入力する時、補正テーブルの補正前に

    かぎかっこかぎかっことじ

    と登録して、補正後に

    「」{←}

    と登録し、以下のようにカーソルが間に入るように出力したいと考えています。

    「|」

    #67018 返信
    みち
    ゲスト

    わいひらさま

    「」の間にカーソルを持っていくというのはいいですね。

    ただ、矢印キーのエミュレートは改行コードとは違って、仮想キーコードをエミュレートする必要があるので、文字と文字の間の任意の場所に矢印キーを挿入するためには、別途ロジックを組んで実装する必要があります。

    なのでこの点については、あらためて対応したいと思います。

    わいひらさんにプログでソフト紹介していただいたおかげで、ダウンロード数とWebサイトへのアクセス数がかなり増えました。
    本当にありがとうございました。

    #67020 返信
    わいひら
    キーマスター

    そうなんですね。
    Delphiとかだと仮想キーのエミュレートはそこまで難しくなかった(良いライブラリがあった)感覚で書いてしまいました、言語や開発環境によっても実装方法は変わってきますよね。
    もし、そこまで大変なものでなかったとしたら、ご検討頂ければ幸いです。

    ブログ記事の方は、最近狙ったキーワードで上位になり、閲覧数も増えてきました。
    そこで、記事を加筆するのに一点確認なんですが、Sokki Voice上で音声入力をオンにした場合、パソコンの音量が下がるのは、Sokki Voiceの機能なのでしょうか。それとも、Chromeの機能なのでしょうか。
    これがかなり便利なので、修正する前に聞いておきたいなと思いまして。

    #67023 返信
    みち
    ゲスト

    わいひらさま

    C♯(.Net Framework)にもSendKeysというメソッドがあって、こっちは仮想キーも文字と同じ感覚でエミュレート出来るんですが(バージョン1はSendKeysを使用してました)、アルファベットや数字など文字として扱いたいものまで仮想キーでエミュレートしてしまい色々不都合があったので現在は違う方法で文字の入力と仮想キーのエミュレートをしています。

    実はバージョン1では文字と文字の間に矢印キーを挿入することが出来たんですが、あんまりそういう使い方をする人はいなそうだなと思って、現在の入力方法に変更するタイミングで消しました。

    ただ、リクエストがあれば復活させようと思ってた点なので、この点はあらためて復活させますね。

    音声入力をオンにしたときにパソコンの音量が下がるのはSokki Voiceの機能ではありません。

    Google ChromeあるいはWindowsの機能だと思います。

    僕はほとんどパソコンで音を出さないので、そういう機能があること自体わいひらさんのブログを読むまで知りませんでした。

    #67027 返信
    みち
    ゲスト

    わいひらさま

    音声認識オン・オフのホットキーは、

    ctrl + shift + F6じゃなくて

    ctrl  + F6でもいいですか?

    押すキーが2つで済むならそれにこしたことはないので。

    あとctrl + alt + shiftも追加しようかと思ってます。

    ctrl + caps lockは試してみたら、shiftも押さないと機能しなかったのでやめました。

    #67029 返信
    わいひら
    キーマスター

    C♯(.Net Framework)にもSendKeysというメソッドがあって、

    やっぱ新しいC#なら当然そういうメソッドもありますよね。
    Delphiで調べたらkeybd_eventでした。
    http://delfusa.main.jp/delfusafloor/archive/www.nifty.ne.jp_forum_fdelphi/samples/00073.html
    Delphiなんてもう誰も使ってないから、当時自分が使ったサンプルコードがそのまま出てきた・笑
    書かれたの1997年て。

    ただ、リクエストがあれば復活させようと思ってた点なので、この点はあらためて復活させますね。

    矢印だけでも、コマンドがあるとめちゃめちゃ助かります。

    音声入力をオンにしたときにパソコンの音量が下がるのはSokki Voiceの機能ではありません。

    Google ChromeあるいはWindowsの機能だと思います。

    僕はほとんどパソコンで音を出さないので、そういう機能があること自体わいひらさんのブログを読むまで知りませんでした。

    そうなんですね。ここは記事の方も加筆しておきます。
    僕はテレビをパソコンで見ているので気づきました。
    ただ最初、「なぜか知らんけど時々パソコンの音が小さいな…」と思っていて、最初故障かと思いました。
    三日後くらいにSokki Voiceを有効にしたら音が小さくなっていったので、ようやく気づきました。
    最初はマジで原因不明だったので、もしかしたら小さな文字でも良いのでChromeのタブに「音声認識を有効にするとパソコンの音量が絞られます」みたいな説明があっても良いのかもしれませんね。

    ctrl + shift + F6じゃなくて

    ctrl + F6でもいいですか?

    僕としてはそれで全然大丈夫です。
    とはいえ、有名ソフトとかが「ctrl + F6」を利用していれば、機能がバッティングして、そのソフトを利用している人って気には問題が出てくるのかもしれません。

    • この返信は6日、 16時間前にわいひらが編集しました。
    #67030 返信
    わいひら
    キーマスター

    調べてみたら、Word 、 Excel 、PowerPointでウィンドウを切り替える時使用しているようです。

    ソフトは有名どころですが、あまり使用するようなショートカットでもないので、大丈夫そうといえば大丈夫そうですが、そこら辺の判断がどうなのかになるのかも。
    もしくはホットキーを利用してもMessageを他のアプリにも流せればいけるのかも(そうできたかは記憶がもはや曖昧…)。

    #67034 返信
    みち
    ゲスト

    わいひらさま

    ありがとうございます。

    ホットキーは他と被らなそうなやつをいくつか選択出来るようにしておきます。

    #67036 返信
    わいひら
    キーマスター

    ありがとうございます。
    そうしていただけると様々なユーザーさんに優しい仕様になるかと思います。

100件の投稿を表示中 - 1 - 100件目 (全100件中)
返信先: Google音声認識を利用した他のWindows用ソフト
あなたの情報:




スポンサーリンク
レクタングル(大)広告
レクタングル(大)広告
NO IMAGE
この記事をお届けした
寝ログの最新ニュース情報を、
いいねしてチェックしよう!