Google音声認識を利用した他のWindows用ソフト

ホーム フォーラム お問い合わせ・ブログや記事に関する質問など Google音声認識を利用した他のWindows用ソフト

  • このトピックには227件の返信、1人の参加者があり、最後にみちにより3週、 6日前に更新されました。
100件の投稿を表示中 - 101 - 200件目 (全228件中)
  • 投稿者
    投稿
  • #67162 返信
    みち
    ゲスト

    わいひらさま

    本日、ベクターに正式版の公開申請をしました。

    音声認識オン・オフのホットキーは4つから選択出来るようにしました(Winを含まないのは2つ)。

    その後ユーザーからのリクエストで、比較的すぐ対応出来る機能は追加しました。

    音声認識されない時間が続いた場合の、音声認識を自動停止するまで時間を、

    30秒、1分、5分、10分、20分から選択出来るようにしました。

    あと音声認識する言語に英語(US)を追加しました。

    あとタスクバーのアイコンを右クリックでメニューを表示できるようにしました。

    2月2日(水)の夕方頃ベクターのサイトを確認して頂けたらと思います。

     

    #67163 返信
    Avatar photoわいひら
    キーマスター

    ご連絡ありがとうございます。
    ホットキー以外の機能も、どれも機能追加をリクエストしようか、どうしようかと地味に迷っていた機能が追加されて嬉しい限りです。
    特に英語の音声認識追加はめちゃくちゃ嬉しいです。日本語ソフトで英語の音声入力対応されているものがなく、英文入力がかなり億劫だったので。
    ベクターに公開されたら試してみたいと思います。

    #67164 返信
    Avatar photoわいひら
    キーマスター

    あと、次のアップデートに向けてダメ元でリクエストさせてください。
    外部の音声入力オンボタンを押して音声入力が開始した場合、直前に入力されていたウィンドウ(コンポーネント)にキャレット(カーソル)を返すようにはできますでしょうか。

    できれば、タスクのオン・オフボタンでもキャレットが返るようになると嬉しいです。
    音声入力をオンにする数だけ、ワンクリック操作する数が減るので、もし可能であればで良いのでよろしければ機能追加いただければ幸いです。

    #67290 返信
    みち
    ゲスト

    わいひらさま

    僕は英語をほとんど使わないので、今まであまり気にしてなかったんですが、やはり英語で音声認識したい方も結構いるんですね。

    今回のアップデートに盛り込んで良かったです!

    キャレットの件は試してみます。

    アプリが独自に矩形を点滅させてるタイプのキャレットは、Win32APIからは情報取得出来なかったと思います。

    ただ、音声認識ONのボタンをクリックする直前にアクティブだったウインドウを、ボタンをクリック後にアクティブにすることは出来るかもしれません。

    そうするともしかしたらキャレットも返るかもしれません。その辺のことを試してみます。

    最近は結構なペースでアップデートしてきたので、次回はちょっとペースを落とすかもしれません。

    よろしくおねがいします。

     

     

     

    #67381 返信
    Avatar photoわいひら
    キーマスター

    英語の音声入力は、僕の下手くそな発音でも結構しっかりと認識してくれるもんですね。
    日本語の音声入力ができるようになってくると、今度は英語の音声入力が面倒くさくなってくるんですよね…。けれど、日本のソフトであるのはVoice Rep Proくらいしかなかったので、あまり選択肢がありませんでした。
    まさかSokki Voiceがこの機能がこの機能をつけてくれるとは思っていませんでした。

    アプリが独自に矩形を点滅させてるタイプのキャレットは、Win32APIからは情報取得出来なかったと思います。

    全然大丈夫です。
    メモ帳のような、標準のコンポーネントとかに戻れるのであれば全然問題ないです。

    ただ、音声認識ONのボタンをクリックする直前にアクティブだったウインドウを、ボタンをクリック後にアクティブにすることは出来るかもしれません。

    この機能です。僕は以前、タイマーコンポーネントでアクティブのウィンドウ番号を変数か何かに入れといて、必要な時にその番号を使って戻すという方法で以前実装にしていました。今ならもっといい方法があるのかもしれませんね。

    最近は結構なペースでアップデートしてきたので、次回はちょっとペースを落とすかもしれません。

    お手隙の歳で全然結構です。
    3ヶ月でも半年でも待ちます。

    #67542 返信
    Avatar photoわいひら
    キーマスター

    記事の方を加筆修正しておきました。

    #67543 返信
    みち
    ゲスト

    わいひらさま

    ブログの加筆修正ありがとうございます。
    早速読ませていただきました。

    ■そういえば音声認識中にPCの出力音量が小さくなる件についてですが、
    僕の僕のPCでYouTubeを見ながら音声認識をしてみましたがPCの出力音量は小さくなりませんでした。

    もしかすると音声認識中に出力音量を絞る機能は、わいひらさんがPCでテレビなどを試聴する際に利用するアプリの機能なのかもしれません。

    ■あともし気が進まなければそのままで良いのですが、
    最近若干ではありますが「ソフトを購入したけど使おうと思ったらうまく使えませんでした。」
    といった問い合わせがありました。
    Sokki Voiceは職場や学校などで機能が制限されてるPCや、Windowsに標準で搭載されているライブラリやフレームワークが使用できないPCなどでは利用できない場合があります。
    簡単でいいので「購入前に一度は試用版で使えるかお試してください。」というような補足を入れていただけるとありがたいです。

    ただ既に最後に「30日間は無料で試せるので、購入前は存分に機能を試してみることをおすすめします。」
    と書いて頂いてるのでもし気がすすまないようであれば今のままでも大丈夫です。

    ■あと一点誤字を見つけましたので連絡します。
    >(僕の知っている限りVoice Repぐらいしか英語入力昨日はついてない)

    英語入力昨日 ⇒ 英語入力機能
    だと思います。

    「わいひらさんのブログを見てソフトを使うことにしました。」という方がかなりいらっしゃいます。
    本当にありがとうございます。

    #67546 返信
    Avatar photoわいひら
    キーマスター

    僕の僕のPCでYouTubeを見ながら音声認識をしてみましたがPCの出力音量は小さくなりませんでした。

    もしかすると音声認識中に出力音量を絞る機能は、わいひらさんがPCでテレビなどを試聴する際に利用するアプリの機能なのかもしれません。

    そんなアプリもなさそうなんですけどねぇ。テレビとか関係なくYouTubeを見ているだけでも小さくなるので。
    とりあえず明後日にでも別のパソコンで確認してみます。

    簡単でいいので「購入前に一度は試用版で使えるかお試してください。」というような補足を入れていただけるとありがたいです。

    「30日間無料で試せる」と書いてあるのに、コンバージョンを見ていると速攻で購入している人結構いるんですよね…。
    難点に追記して、文末にも注意書きを追加しました。

    これだけ書いておけば大丈夫かなと。

    ■あと一点誤字を見つけましたので連絡します。

    こちらも修正させて頂きました。

    「わいひらさんのブログを見てソフトを使うことにしました。」という方がかなりいらっしゃいます。
    本当にありがとうございます。

    コンバージョンを見ていると、多少ながらも最近発生する頻度も高くなってきて記事を書いた甲斐がありました。
    狙ったSEOワードでも上位を取れているので、かなりアクセスも増えました。
    やっぱ、SEO集客はコンバージョンも高くてやっぱ重要だなと改めて思いました。

    #67547 返信
    Avatar photoわいひら
    キーマスター

    あと、何度も使っているうちに不便だなと思う部分がありました。

    Sokki Voiceのメインフォームと、音声認識オンオフフォーム、補足テーブル入力フォームなどは、ほどよい場所に位置を移動し閉じると、再起動した後はまたデフォルトの位置に戻ってしまいます。
    できれば、前回移動したポジションと縦幅・横幅 情報は設定情報に記録され、次回起動時は終了時のポジションで起動してくれるとありがたいです。

    いつも起動すると、ポジションを修正するとこから始める必要があるので少し手間がかかります。僕の場合ソフトキーボードを使用しているので、ホームの位置取りが重要になってきます…(ソフトキーボードが場所をとるので)。
    音声入力ソフトは僕のような手に障害のある人結構使うので、そういった方で同様に思っている方もそれなりにいる可能性もあるかもしれません。多分。。

    加えて今回のアップデートで以前書いた矢印のエミュレート機能は入っていないんですよね?
    ただ、実装が難しいようでしたら諦めます。

    #67550 返信
    みち
    ゲスト

    <p style=”text-align: left;”>わいひらさま</p>
    ブログの追記と修正ありがとうございます。

    フォームの位置とサイズの件は次回のアップデートに含めようと思います。

    矢印キーのエミュレートも次回入れるつもりです。

    矢印キーのエミュレートはアプリへの入力に直接影響する部分なのであまりバタバタしたなかで変更したくなかったので今回のアップデートには含めませんでした。

    あとひとつ教えて頂きたいのですが、わいひらさんはWindows 8を使用しているとのことですが、PCにインストールされている.NetFrameworkのバージョンは何になりますか。

    もし手間じゃなければ教えて頂ければと思います。

    #67553 返信
    Avatar photoわいひら
    キーマスター

    僕のバージョンの見方があっているのかどうか分かりませんが、レジストリを見る限りでは.NET Framework 4.8っぽいです。
    https://docs.microsoft.com/ja-jp/dotnet/framework/migration-guide/how-to-determine-which-versions-are-installed
    Windows 8.1なので正しいのかはわかりませんが。

    #67554 返信
    みち
    ゲスト

    わいひらさま

    ありがとうございます。

    Sokki VoiceはWindows 7では動かないんですが、Windows 8では動いているとのことだったので.NETFrameworkのバージョンを質問させて頂きました。

    Sokki Voiceは4.7以降であれば動くはずなのでわいひらさんのPCで動いているのも納得です。

    ありがとうございました。

    #67555 返信
    みち
    ゲスト

    わいひらさま

    わいひらさまのアクセス数のグラフを見ると土日よりも平日の方がアクセス数が少し多いようですね。

    僕のウェブサイトも同じ傾向があるので、職場でSokki Voiceを使おうとしている人がいるんだなと思いました。

    ウェブ関係の仕事をしているわいひらさんにこんなこというのも失礼かもしれませんが、検索ワードで上位に食い込めるのは凄いですね。

    僕も検索順位あげようと、少しですが色々してみた時はあんまり効果ありませんでした。

    ただ僕は基本的には会社員で、Sokki Voice関係に使える時間も子供が寝てる間だったりとか限られてるので、ソフトのアップデートをメインにして、ソフトのクオリティを上げるのを楽しんでる感じです。

    話しが戻りますが、わいひらさまの寝ログの影響は本当に大きいです。

    ありがとうございます。

     

    #67603 返信
    Avatar photoわいひら
    キーマスター

    今日試しに他のパソコンで音量が小さくなるか試してみました。
    すると、別のパソコンでは音は小さくなりませんでした。
    なので、音が小さくならないのがデフォなんだと思います。勘違いで申し訳ないです。
    何かのドライバーとかが関係あるんだろうか…。

    僕も検索順位あげようと、少しですが色々してみた時はあんまり効果ありませんでした。

    現在、SEOとしては権威性が重要です。現時点でも「Sokki Voice」という音声入力ソフトの権威性は間違いなくサークルロードにあるので「Windows Google音声入力」とかでの権威も間違いなく、上がってくると思います。
    現時点で、日本のGoogle音声認識では間違いなくNo.1のソフトですし、今後さらにクオリティーが上がるのだとしたら、ソフト紹介者も増え被リンクも増えると思うので、時間がたちさえすれば、僕のサイトより音声認識関係のキーワードで上位表示されると思います。
    そしてさらに、もう少しソフトが有名になれば、単にソフトのクオリティーを上げるだけで上位表示されるフェーズに入りそうな感じでもあります。
    現時点で「”Sokki Voice”」と検索しても結構紹介されている方が増えているので今後も増えるんじゃないかなぁと。
    というか、すでに紹介動画も出てるんですね。

    あと、アクティブ(能動的)にやらなくても効果的なSEOとしては、フォーラム運営も、面倒に見えて結構手っ取り早いかもしれません(来た質問に答える受動的手法)。
    フォーラム運営の利点はこちら。

    1. ユーザーの細かな使い方の質問などがフォーラムのタイトルになるのでロングテール検索流入を狙える
    2. メールサポートだとWEBに載らなくて同じ質問に何度も答える必要が出てくるけどフォーラムだとユーザーが検索で解決方法を見つけてくれる可能性がある
    3. フォーラムの内容がたまれば問い合わせ数が激減する(問い合わせは面倒くさいのでユーザーはまずは検索する人が多いので)
    4. フォーラムでしっかりと対応していればソフトへの信頼度も上がる

    Cocoonとかも、2~3割ぐらいがフォーラムへの流入で、おまけにメールでの問い合わせも激減するので結構重宝しています。
    もちろん、雑な対応をすると逆効果の可能性もあるので、そこらへんに一考の余地はあります。

    #67605 返信
    Avatar photoわいひら
    キーマスター

    Sokki Voice記事の音量が小さくなる箇所については削除して記事を修正しておきました。

    #67664 返信
    みち
    ゲスト

    わいひらさま

    記事の修整ありがとうございます。

    フォーラムの導入はメリットが多いのですね。今後フォーラムを導入するか検討してみます。

    多くのアドバイスありがとうございます。

     

    #68152 返信
    sappy
    ゲスト

    みちさま

    わいひらさま

    はじめまして。

    どうしても追加していただきたい機能の要望があり、はじめてコメントいたします。

    数字を音声入力をした際に、3桁区切りでカンマを自動付与できるようにしていただけないでしょうか。

    桁数の大きな数字を入力することが多く、カンマ区切りが必須のため、ご検討いただけますと幸いです。

    よろしくお願いいたします。

    #68242 返信
    みち
    ゲスト

    <p style=”text-align: left;”>Sappy様</p>
    3桁区切り了解しました。

    次のアップデートに盛り込もうと思います。

    わいひらさま

    補正機能での矢印キーのエミュレートと、音声認識オン・オフを切り替えた時にキャレットを返すようにする事は出来ました(タスクバーのアイコンからも)。

    ウィンドウサイズと位置に関しても、オン・オフウィンドウ(小さいウィンドウ)までは完了しました。

    最近仕事が忙しくてそれ以降進んでませんが、要望があったものは次回のアップデートに盛り込めそうです。

    ただ、ここしばらくベクターはシステムトラブル中で作者ページにログイン出来ない状態が続いてます。

    なので次回のアップデート時期はまだなんとも言えないです。

    #68243 返信
    Avatar photoわいひら
    キーマスター

    要望に応えてくださりありがとうございます!
    キャレットやキーボードエミュレート助かります。
    より使いやすくなります。

    ただ、ここしばらくベクターはシステムトラブル中で作者ページにログイン出来ない状態が続いてます。

    ベクター、そんなことになってるんですね…。
    もっと使いやすくなればいいのに。タイトルとかも変更できるようになって。
    急いでおりませんので、気長に待たせていただきます。

    #68244 返信
    みち
    ゲスト

    わいひら様

    Sappy様

    補足説明させてください。

    ■数字の3桁区切りについて

    3桁区切りに関しては、任意の文字列の中に含む数字に対して行うように検討してみます。例えば

    「この洋服は15200円です。」⇒「この洋服は15,200円です。」

    おそらく上のようにできると思いますが、まだ全く試していないのでもしうまくいかなかった場合はご容赦ください。

     

    ■ベクターのシステムトラブルについて

    現在は作者ページにはログインすることができません(新しいソフトの公開申請もできない)が、一般の利用者がソフトをダウンロードしたり購入したりすることはできるようです。

    よろしくお願いします。

    #68457 返信
    みち
    ゲスト

    わいひら様

    Sokki Voiceのアップデートに関して予定していた内容の機能の追加はできて現在は動作確認をしているところです。

    あとマニュアルなどを準備して4月の上旬頃に公開できればと思っています。

    ■メインウィンドウと補正テーブルのウィンドウに関しても、そのサイズと位置あとスクロールバーの位置の前回の値を保存して、ソフトを起動した時に最後に使用した状態で開けるようにしました。

    ■補正テーブルの一覧表の高さはウィンドウの高さに自動で合わせるように変更しました。

    ■数字の3桁区切りなど、これまでの投稿で記載した内容についても機能追加できました。

    今回のアップデートで思いの外手こずったのはメインウィンドウと補正テーブルの前回のサイズと位置とスクロールバーの位置を保存して、次回起動した時も同じように表示する部分でした。

    メインウィンドウと補正テーブルに関してはスクロールバーが出てきてその部分は当初思ってたよりもやっかいでした。やっぱりプログラミングというのは実際作ってみないと分からないものですね。

    またベクターに公開の申請をしたら連絡します。

    よろしくお願いいたします。

     

     

    #68494 返信
    Avatar photoわいひら
    キーマスター

    御苦労様です。おお、ついに!

    ■補正テーブルの一覧表の高さはウィンドウの高さに自動で合わせるように変更しました。

    これ以前から僕も思っていて、リクエストしようかずっと迷っていた機能です。
    実装されて嬉しいです。

    あと一つ質問です。
    最近、モニターを購入して以前1920×1200だった解像度が、3840×2160になりました。
    ただ、そのように解像度が変わっても、Sokki Voiceのメインフォームは画面いっぱいに表示されます。
    https://nelog.jp/wp-content/uploads/2022/03/2022-03-28_23h18_32.png
    1920×1200だったときも同じ割合で表示されていたような。
    Sokki Voiceのメインフォームの大きさは、指定されたpx単位とかではなくて、画面幅の大きさに対して作成されているのでしょうか。
    これは、要望関係の質問とかではなくて、単なる興味からの質問です。

    それでは、新バージョン楽しみにしております!

    #68495 返信
    Avatar photoわいひら
    キーマスター

    そういえば以前みちさんがおっしゃられていた「ブラウザとの音声認識接続が勝手に切れる」という現象に僕の環境でも何度かなりました。
    とはいえ、ごく稀にしか起こらないですし、しかも再接続すれば再び直ぐに音声認識できるので、あまり気にはなりませんでした。

    #68538 返信
    みち
    ゲスト

    わいひら様

    Sokki Voiceのメインフォームの大きさは、指定されたpx単位とかではなくて、画面幅の大きさに対して作成されているのでしょうか。

    Sokki Voiceのフォームの大きさは画面の幅と高さに対して作成しています。

    またボタンなどのコントロールの大きさや位置に関してもディスプレイサイズに対して計算して配置しています。

    .NET Frameworkのオプションで簡単に画面の幅と高さに合わせることができるものもあるのですが、それを使うと画像を引き伸ばして表示することに起因して、ぼやけてしまうので、少し手間ですがディスプレイサイズからすべて計算して表示しています。

    そういえば以前みちさんがおっしゃられていた「ブラウザとの音声認識接続が勝手に切れる」という現象に僕の環境でも何度かなりました。
    とはいえ、ごく稀にしか起こらないですし転送、しかも再接続すれば再び直ぐに音声認識できるので、あまり気にはなりませんでした。

    あまり気にならない程度で良かったです。

    この現象に関してはPCの負荷が高い状態などでメモリやバッテリーの消費を節約したりするためにブラウザーが行うようです。

    ■これは実用性とはあまり関係ないかもしれませんが、変換中のテキストをダイアログで表示するオプションも追加しました。変換中ダイアログのサイズを大にすると変換中のテキストをダイアログで表示します。

    ■音声認識オンオフウィンドウのマイクのボタンのサイズを2倍にしたり、マイクボタンのみを表示するオプションも追加しました。これは主にタブレットユーザーを想定してのオプションです。

     

    #68539 返信
    みち
    ゲスト

    貼ってくれたリンクの画像を見ていませんでした。

    わいひら様もついにWindows 11にしたんですね。

    Windows 11はWindowsの標準の音声入力もかなり改善していますね。

    #68603 返信
    Avatar photoわいひら
    キーマスター

    ■音声認識オンオフウィンドウのマイクのボタンのサイズを2倍にしたり、マイクボタンのみを表示するオプションも追加しました。これは主にタブレットユーザーを想定してのオプションです。

    これは僕にとってもありがたい機能です。

    わいひら様もついにWindows 11にしたんですね。

    はい。最近購入しました。
    基本的にWindows11はいい感じなんですが、タスクバーが下にしかできないのだけキツイ…。
    レジストリを変更すれば移動はできますが、不具合が出るし。

    Windows 11はWindowsの標準の音声入力もかなり改善していますね。

    これは「ブラウザー」設定で「Microsoft Edge」を選択した際の音声入力でしょうか。

    #68605 返信
    みち
    ゲスト

    わいひら様

    タッチキーボードのマイクのアイコンをクリックするとディクテーションすることができます。

    音声認識の精度はかなり良くなってると思います。

    ただキーボード操作するたびに音声認識がオフになってしまいます。

    こちらもインターネットに接続されていないと音声認識できないようです。

    マイクのアイコンをクリックすると音声入力できます。

     

     

    #68705 返信
    Avatar photoわいひら
    キーマスター

    タッチキーボードにそんな機能があったんですね。
    たしかに結構認識精度が良いかも。

    #68706 返信
    みち
    ゲスト

    わいひら様

    本日ベクターにSokki Voice Ver.3.1.0の公開申請をしました。

    4月6日水曜日の夕方頃ベクターをチェックしてみてください。

    また今回のアップデートで追加した機能については、僕のウェブサイトに記載しています。

    https://circle-road.com/

    よろしくお願いします。

     

    #68707 返信
    Avatar photoわいひら
    キーマスター

    体調不良で遅くなりました。

    本日、最新版を使用してみました。

    最初、「あれっ?フォームのサイズが保存されない」と思ったら「詳細設定」オプションで設定する必要があるんですね。
    設定をしたら思い描いていた通りの動作になりました。
    すごく使いやすくなりました。
    キャレット移動なども非常にスムーズでさらに便利になりました。
    要望を取り入れてくださりありがとうございます!

    #68708 返信
    Avatar photoわいひら
    キーマスター

    僕の要望ではないですけど、数字区切りもあるとやっぱ便利ですね^^

    #68709 返信
    みち
    ゲスト

    わいひら様

    思っていたとおりの操作性になったということで良かったです。

    僕は今まで気づかなかったんですが、音声入力後に変換キーを押した時も最後の単語とかは再変換できるんですね。

    使用するIMEソフトによるのかもしれませんが、同音異義語の単語の変換程度であればこれでもある程度対応できそうです。

     

     

    #69192 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。
    Sokki Voiceの次のバージョン(Ver.3.2.0)を本日Vectorに公開申請しました。
    順調にいけば6月15日(水)の夕方頃にVectorから公開されると思います。

    今回のアップデート内容:
    ①.「Enterキー」および「Shiftキーを押しながらEnterキー」を音声でエミュレートできるようにしました(補正機能またはキーワード入力を利用)。
    WordPressやGmailなどでも音声で文章の改行や改段落ができるようになります。

    ※ユーザーによっては音声でEnterキーをエミュレートできる必要はないという人もいますので詳細設定画面でEnterキーのエミュレートを許可した場合に使用できる機能にしました。

    ②. 音声認識がオンのまま認識する言語の設定を変更できるように改良しました。
    もし頻繁に音声認識する言語を切り替えるようでしたらを使ってみてください。
    ※こちらも詳細設定画面から設定した場合に有効になる機能です。

     

    ■また今後のアップデートに関してなんですが、
    わいひら様は音声でControrlキー、ShiftキーやWindowsキーなどの任意のキーのエミュレート(同時押し含む)をできるようにしたら使いますか?

    僕は最初はショートカットキーについてはわざわざ音声でやる必要がないんじゃないかなと思ってましたが、だんだん音声入力しているうちにその辺の機能もあってもいいような気がしてきました。

    #69194 返信
    Avatar photoわいひら
    キーマスター

    おお!バージョンアップ楽しみです。

    ①は「Enterキー」および「Shiftキーを押しながらEnterキー」というのは、カギカッコ内の言葉を発したら、そのようにキーエミュレートするということでしょうか?

    ②機能もいいですね。
    というのも、音声入力をしているとここは半角の英語で入力したいということも結構あるからです。

    わいひら様は音声でControrlキー、ShiftキーやWindowsキーなどの任意のキーのエミュレート(同時押し含む)をできるようにしたら使いますか?

    僕はめちゃくちゃ使うと思います。
    というのも僕は、身体的な不都合があるのでキーボードを押すより音声操作できた方が楽だからです。
    その機能は「Ctrl + V」とかもできるようになるのでしょうか。だとしたらかなり熱いですね!!

    #69195 返信
    みち
    ゲスト

    わいひら様

    お世話になっています。

    1点不具合が見つかって、今日改めてVer.3.2.1としてベクターに申請しました。

     

    ①は「Enterキー」および「Shiftキーを押しながらEnterキー」というのは、カギカッコ内の言葉を発したら、そのようにキーエミュレートするということでしょうか?

    Enterキーのエミュレートに関しては補正機能やキーワード入力を利用する形にしており、エミュレートするための音声はユーザーが自分で設定できるようにしています。

    僕はめちゃくちゃ使うと思います。
    というのも僕は、身体的な不都合があるのでキーボードを押すより音声操作できた方が楽だからです。
    その機能は「Ctrl + V」とかもできるようになるのでしょうか。だとしたらかなり熱いですね!!

    そうなんですね。ではその次のアップデートに関しては、任意のキーボード操作のエミュレートを音声で出来る形で進めたいと思います。

    「Ctrl+V」はできるようになる予定です。
    基本的にはショートカットキーは同時押しが多いので、キーボードの同時押しを想定した形で任意のキーの組み合わせを出来るようにしようと思ってます。マウスの左クリックとか右クリックもできそうなのでそれも入れる方向で検討したいと思います。(実際には試してませんが)。
    ただ英語キーボードと日本語キーボードで動きが変わってくるようなキーについてはやめておこうかなと思います。

    ちょっとどうしようか迷ってるのは、同時押しではなくて例えば「キーAを押して、キーAを開放してから、キーBを押してキーBを解放する」というようなケースをどのような形でユーザーに設定してもらうのかちょっと迷ってます。

    今考えてるのは、

    Ctrlを押しながらVは:[Ctrl] + [V]

    「キーAを押して、キーAを開放してから、キーBを押してキーBを解放する」は
    :[A]+[A]+[B]

    (2回目の[A]はキーの解放を意味する)というような形で途中でキーを開放するケースに対応しようかと思ってます。同じキーが複数設定されてる場合は偶数番目は解放を意味する形にしようかと思っています。
    [Ctrl] + [V]と設定した場合は「Ctrlを押して、Vを押して、Ctrlを解放して、Vを解放する」という形にする方向で今のところ考えています。

     

    #69196 返信
    みち
    ゲスト

    わいひら様

    前回の投稿の続きですが、

    [A]+[A]+[B]

    よりは

    [A]-[A]+[B]

    のようにマイナスをキーの開放とした方がわかりやすそうですね。

    任意のキーのエミュレートの設定については、専用の設定画面を用意して画面上のボタンから設定するかたちにしようと思います。

    上記のプラスやマイナスはユーザーが指定するのではなくて、ソフト側でどっちにすべきか判断できるかたちにしようと思います。

    あと任意のキーのエミュレートは現在の音声コマンドの拡張版のような形にすると思います。

     

    #69229 返信
    Avatar photoわいひら
    キーマスター

    ちょっとどうしようか迷ってるのは、同時押しではなくて例えば「キーAを押して、キーAを開放してから、キーBを押してキーBを解放する」というようなケースをどのような形でユーザーに設定してもらうのかちょっと迷ってます。

    これはどういった場面を想定した機能なんでしょうか。
    マクロ的な機能でしょうか。

    キーAを押して、キーAを開放してから

    WindowsイベントのKeyDownとKeyUp的なことでしょうか。

    #69241 返信
    みち
    ゲスト

    使うケースは少なそうですが、

    エクセルのワークシートを変更するショートカットで

    Alt →O→H→R

    というのがありました。

    任意タイミングでキーアップさせようとすると前回の投稿みたいな感じになりそうです。

    #69288 返信
    Avatar photoわいひら
    キーマスター

    エクセルのワークシートを変更するショートカットで

    Alt →O→H→R

    というのがありました。

    こういうショートカットがあるのは初めて知りました。
    使ったことがないので、ちょっと詳しいことわからないかもしれません…。

    #69289 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    あらためてショートカットキーの一覧を色々調べてみましたが、
    任意のタイミングでキーアップする必要があるようなものは僕が見た限りではありませんでした。

    なのでユーザーが設定する時のUIへの表示方法は、
    Ctrlを押しながらZ:Ctrl + Z
    Aを押して離した後にBを押してBを離す:A →B
    のようにしようと思います(こっちの方が誰が見てもわかりやすいような気がするので)。

    マイナスでキーアップを表示するというのは、パッと見て分かりにくいし無駄にソースコードが複雑になりそうなので、任意のタイミングでキーアップする必要が出てきた際に対応しようかなと思います。

    #69316 返信
    Avatar photoわいひら
    キーマスター

    僕も、以前ショートカットのエミュレート機能を付けた時は、キーダウン・キーアップまでは使わないで、キープレスイベントでやった記憶があります(※開発環境が違うので仕様は違うのかもしれませんが…)。
    その後も、特に変更はした覚えはないので、確かに必要性が出てこない限り、難しくする必要はなさそうですよね。

    #69335 返信
    Avatar photoわいひら
    キーマスター

    こんにちは。
    最新版をダウンロードしてしばらく使用してみました。

    ①.「Enterキー」および「Shiftキーを押しながらEnterキー」を音声でエミュレートできるようにしました(補正機能またはキーワード入力を利用)。
    WordPressやGmailなどでも音声で文章の改行や改段落ができるようになります。

    ただ上記の機能ですが、「エンターキー」もしくは「シフトキーを押しながらEnterキー」と発声しても、きエミュレートされないようです。
    もちろん「詳細設定」の「Enterキーのエミュレートを許可する」のチェックボックスは有効にしております。
    何か他に設定等が必要なのでしょうか。

    その他の新機能は問題なく動作しております。

    #69336 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    EnterキーまたShift+Enterなどをエミュレートするには、補正テーブルまたはキーワード入力でエミュレートするための言葉を設定する必要があります。

    下記のリンクに説明がありますのでご確認していただけたらと思います。

    https://circle-road.com/?page_id=77#toc1

    例えばキーワード入力で「私の住所と電話番号」に

    住所:〇〇県□□市XXX-Y{Shift+Enter}携帯番号:090-XXXX-YYYY

    と設定すると、

    住所:〇〇県□□市XXX-Y
    携帯番号:090-XXXX-YYYY

    という感じで改行を挟んで住所と電話番号を入力するというような使い方もできます。

    #69361 返信
    Avatar photoわいひら
    キーマスター

    補正テーブルでの設定が必要だったんですね。
    早速登録して動作確認してみました。
    すると、以前は改行動作しなかった環境でも、きびきびと改行するようになりました。
    これでさらに便利になりました。

    #69387 返信
    みち
    ゲスト

    わいひら様

    Enterキーのエミュレートが動作してよかったです。

    今は任意のキーをエミュレートする機能について作成をはじめて、
    設定したキーをエミュレートするところまではできていろいろショートカットキー試しているところです。

    大体のショートカットキーは音声コマンドでエミュレートして機能しています。

    [マウス左ボタン]→[Ctrl]+[C]
    のようにしてマウスを左クリックした後コピーするというようなことも可能でした。

    [Windows] +[V]でクリップボードの履歴を表示することもできました。

    ただ実際にキーボードを操作してショートカットキーを押すのと、仮想キーをソフトからエミュレートするのではPCの動作が異なるケースもあるようです。
    動作が異なる原因は仮想キーをエミュレートする場合はキーダウンからキーアップまでの時間が実際にキーボードを操作する時に比べて極めて短いため起こるようです。(僕はWin 32 APIのSend Inputを利用しています。)

    仮想キーをエミュレートする場合も、キーダウンとキーアップ処理を分けてその間に100 mmsec程度の時間をあければキーボードを操作する場合と同じ動作になりました。

    ただキーダウンとキーアップの処理を分けるのはリスクがあるのでやめておこうと思います(キーアップする前にSokki Voiceが強制終了された場合にキーダウンしたままになってしまう)。

    ■後質問なのですが、わいひら様が使用してるソフトキーボードのショートカットからSokki Voiceの音声認識のオンオフは切り替えできていますか?

    Sokki Voiceは10mmsecの間隔でキーボードが押されてるかどうかをチェックして音声認識オンオフのショートカットキーが押されたかどうか判断しているのですが、ソフトキーボードのエミュレートが10msecよりも短い時間で完了する場合はエミュレートされたことを検出することができません。

    #69390 返信
    Avatar photoわいひら
    キーマスター

    ■後質問なのですが、わいひら様が使用してるソフトキーボードのショートカットからSokki Voiceの音声認識のオンオフは切り替えできていますか?

    残念ながら、僕が普段使いしているTrail Soft Keyboardだとどのキーエミュレートでも利用できなかったです。
    http://ww3.tiki.ne.jp/~k_nakada/tsk.html

    Windowsデフォルトで据え置きのスクリーンキーボードだと、Ctrl、Shift、Alt、Win等を一つ一つ選択していき、最後にキーアップした時に動作します。ただ、Ctrl、Shift、Alt、Winはキーダウン状態で固定されるので、一つ一つ解除しなければなりません。
    なので、最大7回マウスをクリックしなければならないので、起動のために使用はしていません。

    #69391 返信
    みち
    ゲスト

    わいひら様

    残念ながら、僕が普段使いしているTrail Soft Keyboardだとどのキーエミュレートでも利用できなかったです。

    そうだったんですね。フォームのkeydownイベントであれば仮想キーのエミュレートも検出できるのですが、Sokki Voiceの場合は自アプリがアクティブになっていない時でもキーが押されたことを検出する必要があるためkeydownイベントを使用できずに、CPUにあまり負荷がかからない程度の間隔でキーが押されたことをチェックしてる感じです。

    とりあえず音声認識のオフについては、音声コマンドから音声認識をオフにできるようにしておきます(キーのエミュレートを使用しないかたち)。

    他の人に使ってもらうにはもう少し時間がかかりますが、ある程度画面もできてきています。

    わいひらさんはSokki Voiceが次のバージョンの試作版ができたら使ってみますか?
    試作版であればそこまで時間がかからなそうです。

     

    #69392 返信
    Avatar photoわいひら
    キーマスター

    わいひらさんはSokki Voiceが次のバージョンの試作版ができたら使ってみますか?

    はい、ぜひ使ってみたいです。

    #69393 返信
    みち
    ゲスト

    了解しました。

    出来たら連絡しますね。

    #69394 返信
    Avatar photoわいひら
    キーマスター

    承知いたしました。
    ありがとうございます。

    #69541 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    ショートカットキーやマウスボタンなどをエミュレートできるように音声コマンドの機能を拡張したバージョンVer.4.0.0.0(バージョン4の試作版)下記のサイトにアップロードしました。

    https://circle-road.com/?wpdmpro=sokki-voice-ver-4-0-0-0-%ef%bc%88ver-4%e3%81%ae%e8%a9%a6%e4%bd%9c%e7%89%88%ef%bc%89

    ダウンロードに必要なパスワード:201381

    になります。

    ショートカットキー以外にも、

    ・音声認識停止コマンド
    ・再入力コマンド(前回音声入力した内容)
    ・直前に音声入力した内容を削除することを想定したキーエミュレート
    ・直前に音声入力した内容をIMEで再変換することを想定したキーエミュレート

    などの機能を追加しました。

    ※マウスボタンのエミュレートについては、タブレットPCなどマウスを使用できない端末での動作確認はまだできておりません。

    ■設定方法について:
    一般的なショートカットキーなどについてはリストから選択して設定できるようにしました。またそれ以外のショートカットキーについては一つ一つキーを指定して設定できるようにもしています。

    追加した機能の操作方法の詳細については付属のPDF「Sokki Voice Ver4.0.0.0追加機能説明.pdf」にてご確認ください。

    ■また、もし今回追加した機能を一から設定するのがめんどくさいようでしたら、
    僕があらかじめ設定した設定ファイルをZIPファイルに同梱してありますのでそちらを必要に応じて修正して使用してみてください。

    ※音声コマンドを実行(エミュレートなど)するための認識結果は補正テーブルの設定の影響を受けるので若干手直しが必要になると思います。

    もし設定済みのファイルを使用するようでしたら、
    「音声コマンド拡張設定の設定例(サンプル)」フォルダの中にある「音声コマンド_拡張設定.tsv」を

    「Sokki_Voice」-「各種ファイル」-「音声キーとコマンド」フォルダの中にコピーして使用してみてください。

    ただ、わいひら様がご自身で設定したあとにファイルをコピーすると「わいひら様が設定した内容」が「僕の設定した内容」に上書きされてしまいますのでその点ご注意下さい。

    ■わいひらさん以外にもこの投稿をみて今回のバージョン(試作版)を使用してみたいという方は使用して頂いて大丈夫です。

    以上よろしくお願いいたします。

     

    #69574 返信
    Avatar photoわいひら
    キーマスター

    返信が大変遅くなり申し訳ありません。
    先月後半から新型コロナウイルス感染症にかかり最近ようやく普段に近い状態に戻りました。
    Sokki Voiceもしてみますね。
    世間的な風潮から風邪みたいなもんだと思っていたら結構しんどかったです。

    #69576 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    先月後半から新型コロナウイルス感染症にかかり最近ようやく普段に近い状態に戻りました。

    そうだったんですね。
    普段に近い状態に戻ったということでよかったです。
    最近は新型コロナウィルスもかなり増えてるのでいつかかってもおかしくない状況ですね。新型コロナ早く収まってほしいですね。

    あまり無理せず、お体を大事にしてください。

    #69577 返信
    Avatar photoわいひら
    キーマスター

    すべての機能を試したわけではないですが、僕が使用するような機能をすべて登録して試してみました。
    結果、すべて問題なく動作しております。
    かなり細かく動作を設定できて、素晴らしい機能ですね。
    音声での音声認識停止機能なども、前から欲しかったのでほんと助かります。

    周りの感染した人にリサーチしてみても、コロナは結構強い症状が出る人は出るみたいなので、みちさんもお気をつけください。

    #69578 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    周りの感染した人にリサーチしてみても、コロナは結構強い症状が出る人は出るみたいなので、みちさんもお気をつけください。

    ありがとうございます。気をつけます。ただ僕の職場も数名は新型コロナウイルスにかかってる人も出ているので僕もそのうち一回はかかると思ってます。

    あと今回追加した機能がうまく機能しているということでよかったです。

    ■僕は現在ATOKを使ってないので教えて頂きたいのですが、ATOKで[変換]キーのエミュレートは機能しているでしょうか?
    機能しているのであれば選択した文字をATOKの変換機能で変換することができるはずです。

    ■あと回数指定型のコマンドについてはもう少し工夫してみます。
    とりあえず「回数を指定してシフト押しながら矢印キー」については発音方法を、

    「左に2個選択」→「左に2文字選択」

    という風に変更する予定です(現在の「左に2個選択」だとExcelでは実際には3個選択されてしまい違和感があるなどの理由)。

    ■あと正式版ではウィンドウの表示倍率を変更する機能をつけようと思います。
    現在はノートPCで使用することを想定してディスプレイいっぱいにさせていますが、大きいディスプレイを使っている人にとっては表示サイズが大きすぎるはずですので全体的に縮小して表示することができるようにしようと思います。

    ただ「音声認識のオンオフを切り替える小さいウィンドウ」のようにすでに小さく表示ているウィンドウについてはそのままのサイズにしておこうかなと思います。

    #69583 返信
    Avatar photoわいひら
    キーマスター

    ■僕は現在ATOKを使ってないので教えて頂きたいのですが、ATOKで[変換]キーのエミュレートは機能しているでしょうか?
    機能しているのであれば選択した文字をATOKの変換機能で変換することができるはずです。

    これは[変換]コマンドのやつですよね?
    これは変換されなかったです。

    ■あと正式版ではウィンドウの表示倍率を変更する機能をつけようと思います。
    現在はノートPCで使用することを想定してディスプレイいっぱいにさせていますが、大きいディスプレイを使っている人にとっては表示サイズが大きすぎるはずですので全体的に縮小して表示することができるようにしようと思います。

    あとこの機能はものすごくありがたいです。
    補正テーブルとかの一覧を大きく表示させてザクザク入力することができるようになるので。

    #69584 返信
    みち
    ゲスト

    わいひら様

    お世話になってます。

    これは[変換]コマンドのやつですよね?

    これは変換されなかったです。

    教えて頂きありがとうございます。

    IMEのオンオフもそうでしたがATOKはキーのエミュレートでのIMEの操作はあんまり出来ない感じなんですね。

    今回追加した機能の中で僕が1番使ってるのは、前回音声入力した文字数の回数だけBack Spaceをエミュレートするコマンドです。もしまだ使ってないようなら使ってみて下さい。

    わいひらさんはSokki Voice.exeのメイン画面は横方向についてはウィンドウサイズはそのままにしてますか?

    #69589 返信
    Avatar photoわいひら
    キーマスター

    IMEのオンオフもそうでしたがATOKはキーのエミュレートでのIMEの操作はあんまり出来ない感じなんですね。

    確かにうまくいってないかもしれません。
    [変換]についてもアプリによって全角・半角が切り替わる動作をしたりします。

    今回追加した機能の中で僕が1番使ってるのは、前回音声入力した文字数の回数だけBack Spaceをエミュレートするコマンドです。もしまだ使ってないようなら使ってみて下さい。

    これ使ってなかったです。確かに便利そう。
    今度設定して使ってみます。

    わいひらさんはSokki Voice.exeのメイン画面は横方向についてはウィンドウサイズはそのままにしてますか?

    横方向のサイズは確かにいじってないかも。
    縦方向の一覧性を確保したくて縦方向を変更しています。

    #69590 返信
    みち
    ゲスト

    わいひら様

    お世話になってます。

    ATOKで選択したテキストを再変換する方法について調べてみました。

    ATOKではMicrosoft IMEやGoogle 日本語入力の[変換]キーとは違い、

    ATOKの場合は[Shift]+[変換]で選択したテキストの変換候補が表示されるようです。

    ■お試し版のATOKをインストールして試したところSokki Voiceの音声コマンド拡張設定で、[Shift]+[変換]を設定することで選択したテキストをATOKで変換することができました。

    また変換候補から選択する際にはMicrosoft IMEやGoogle 日本語入力の[3]→[Enter]と違い、

    ATOKの場合は[3]などのように対象の数字のキーだけ操作すれば良いようです。

     

    あとなんでかはわかりませんが選択したテキストを再変換する際は変換候補を下矢印のカーソルキーで選択することはできませんでした。数字のキーを操作する必要があるようです。

     

    ■また直前に音声入力した内容をATOKで再変換するコマンドは、「リストから選択」のタブで

    {Shift+[←]×(前回入力した文字数)}を入力した後に、「カスタム設定」のタブから[Shift]+[変換]を追加して

    {Shift+[←]×(前回入力した文字数)}→[Shift]+[変換]

    というコマンドを作成することで実行できると思いますのでもしよければ試してみてください。

     

    #69617 返信
    みち
    ゲスト

    わいひら様

    お世話になってます。

    表示倍率を変更機能を盛りこんだ試作版のSokki Voice(Ver.4.0.0.4)を下記リンクのウェブサイトにアップロードしました。

    良ければ試して下さい。

    https://circle-road.com/?wpdmpro=sokki-voice-ver-4-0-0-0-%ef%bc%88ver-4%e3%81%ae%e8%a9%a6%e4%bd%9c%e7%89%88%ef%bc%89

     

    ダウンロードに必要なパスワード:201381

     

    ■変更内容

    ・表示倍率はメインウィンドウの左上の表示メニューから変更出来ます。

    ・音声コマンド拡張設定のWindowsキーを含むショートカットキーのリストに、「仮想デスクトップの追加」、「仮想デスクトップの削除」、「仮想デスクトップの切替」を追加しました(2回連続で切り替えるコマンドも追加しました)。

    ・ATOKでの再変換を想定した音声コマンドをリストから選択できるように追加しました(直前に入力したテキストの再変換など)。

    #69622 返信
    Avatar photoわいひら
    キーマスター

    すいません。
    先日の返信の通知メールがメーラーの中で埋もれて気づきませんでした。

    ■お試し版のATOKをインストールして試したところSokki Voiceの音声コマンド拡張設定で、[Shift]+[変換]を設定することで選択したテキストをATOKで変換することができました。

    教えていただきありがとうございます!
    Windowsのメモ帳でできました!
    普段使用している捨て書き用に作った自作のエディターとかだとダメなようです。
    http://netakiri.net/soft/memo.shtml
    もしかしたら、大昔の古いWindowsコンポーネントを使用したものだと駄目なのかも…。
    ただブラウザやWordなどでは問題なく利用できるので、この仕様を理解した上で使わせていただきます!
    この機能マジで便利ですね。

    表示倍率を変更機能を盛りこんだ試作版のSokki Voice(Ver.4.0.0.4)を下記リンクのウェブサイトにアップロードしました。

    明日にでも利用して、また書き込ませていただきます。

    #69623 返信
    Avatar photoわいひら
    キーマスター

    やっぱ速攻で使わせて頂きました。

    ・表示倍率はメインウィンドウの左上の表示メニューから変更出来ます。

    この機能、めっちゃありがたいです。
    これまで、フォームのサイズが大きくてマウスキーボードにかぶってたんですけど、被らないサイズにすることができました!

    ・音声コマンド拡張設定のWindowsキーを含むショートカットキーのリストに、「仮想デスクトップの追加」、「仮想デスクトップの削除」、「仮想デスクトップの切替」を追加しました(2回連続で切り替えるコマンドも追加しました)。

    どんどんいろんなことができるようになりますね。
    障害で腕すら動かせない人とかにとっては、自由に設定できてすごくありがたい機能になると思います。

    ・ATOKでの再変換を想定した音声コマンドをリストから選択できるように追加しました(直前に入力したテキストの再変換など)。

    これらの「文字の選択、変換、削除、再入力」機能、動作が分かって使いこなせるようになるとやばいぐらいに音声入力が捗りますね!

    あと「表示」メニューの「マイクボタンのみ表示」機能が地味に(というかかなり)ありがたいです。
    小さく表示させてボタンだけにすると、アプリの隙間にほどよく収まります。

    #69625 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    追加した機能でSokki Voiceの使い勝手が向上してよかったです。Ver.4の正式版は機能的にはこの形でいこうと思います(若干程度の微調整はするかもしれません)。

    前回の投稿で書き忘れましたが、補正テーブルの1テーブル辺りの最大設定個数を2000から5000に増やしました。
    ただ5000項目設定してみたところ補正テーブルのウィンドウを開くのに結構時間がかかってしまうので、この点については今後のアップデートでどうするか検討したいと思います。

    Vectorから公開する正式版は9月の中旬頃に公開できたらと思っています。

    #69629 返信
    Avatar photoわいひら
    キーマスター

    一点、以下の機能について質問させてください。

    あと「表示」メニューの「マイクボタンのみ表示」機能が地味に(というかかなり)ありがたいです。

    こちらの「マイクボタンのみ表示したダイアログ」を非表示にする手段は、一旦「表示」メニューから通常の状態に戻して閉じるボタンを押すしか内のでしょうか。

    #69630 返信
    みち
    ゲスト

    わいひら様

    お世話になってます。

    タスクトレイのアイコンの右クリックのメニューからも「音声認識のオンオフするウィンドウ」の表示・非表示を切り替える事も出来ます。

    マイクボタンのみ表示する機能については、どちらかというとバツボタンを非表示にしてほしいというリクエストから追加した機能です。

    #69886 返信
    みち
    ゲスト

    わいひら様

    お世話になっています。

    今月に公開予定の正式版ではマイクボタンのみ表示した場合でも音声認識する言語の変更をしやすくするために、
    タスクトレイ(通知領域)のアイコンの右クリックのメニューからも音声認識する言語の変更をできるようにしときました。

     

     

    #69889 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    質問ですが、
    以前は音声入力時のIMEの入力モードの切り替えで「切替方法A」の場合はATOKやGoogle 日本語入力ではIMEの入力モードが音声入力後に元に戻らなかったのですが、
    今日僕の実家のATOKが使えるPCで試してみたところ「切替方法A」でもIMEの入力モードが音声入力後に元に戻るようになってました(ひらがなモードしか試せていませんが)。

    またGoogle 日本語入力でも元に戻るようになってました(ひらがなモードの場合)。

    切替方法Aで元に戻るのであれば、切替方法Bよりも切替方法Aのほうがいいと思いますので試してみてください。(切替方法Aは元のモードに戻すタイミングの問題が発生しないので)

    #70128 返信
    Avatar photoわいひら
    キーマスター

    タスクトレイのアイコンの右クリックのメニューからも「音声認識のオンオフするウィンドウ」の表示・非表示を切り替える事も出来ます。

    こちらには気づいておりませんでした。
    教えていただきありがとうございます!

    今月に公開予定の正式版ではマイクボタンのみ表示した場合でも音声認識する言語の変更をしやすくするために、
    タスクトレイ(通知領域)のアイコンの右クリックのメニューからも音声認識する言語の変更をできるようにしときました。

    これは、設定状態によっては結構手順のかかる変更だったので、2クリックで手軽に変更できるようになる像はありがたいです。

    切替方法Aで元に戻るのであれば、切替方法Bよりも切替方法Aのほうがいいと思いますので試してみてください。(切替方法Aは元のモードに戻すタイミングの問題が発生しないので)

    いつ変更したのかは覚えていませんが、最近は「切替方法A」で利用していたみたいです。
    それでいて問題なく利用できていました。
    ありがとうございます。

    #70129 返信
    Avatar photoわいひら
    キーマスター

    いつもSokki Voiceのアップデートありがとうございます。
    最近さらに欲しい機能が充実してありがたく利用させていただいています。
    何か開発の足しになればと、フォーラムへの登録メールアドレスにAmazonギフト券を送らせていただきました。
    開発支援としてお受け取りいただければ幸いです。

    #70134 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    ブログで紹介してもらっただけでもありがたいのに、Amazonのギフト券までありがとうございます。
    ありがたく有効活用させていただきます。

    IMEの入力モードの切り替え方法については、デフォルトがAなのでもしかしたらWindows 11にした時からAだったのかもしれませんね。

    IMEの入力モードの切替方法Aで問題なく動作するようになってよかったです。
    (この点については僕の方はプログラムは特に変えたわけではないですが。)

     

    #70135 返信
    Avatar photoわいひら
    キーマスター

    いえいえ、ほんとSokki Voiceには、いつもデスクワークを助けていただいています。

    IMEの入力モードの切り替え方法については、デフォルトがAなのでもしかしたらWindows 11にした時からAだったのかもしれませんね。

    もしかしたらその可能性もあるかも。
    とりあえず、今は問題なく動作しています。

    #70171 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    本日、Sokki Voiceの次のバージョンの正式版Ver.4.0.1の公開申請をベクターにしました。順調にいけば9月28日(水)の夕方頃に公開されると思うのでチェックしてみてください。

    今回のアップデートでの主な機能追加は前回までの投稿内容の通りです。

    不具合修正については、
    補正テーブルと音声コマンド拡張設定のウィンドウを最後に使用した場所とサイズで開く設定にしても、補正テーブルと音声コマンド拡張設定のウィンドウが最後に使用した位置で開かれずにモニターの左上で開く不具合を修正しました。

    #70172 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    先日WordPressでSokki Voiceのオンライン用のマニュアルを作成してる時に気付いたのですが、

    WordPressとATOKの組み合わせだと、
    「テキストの選択」と「Shift+変換」を2回の音声コマンドに分けて実行する場合は問題ないのですが、
    1回の音声コマンドでまとめて「テキストの選択」と「Shift+変換」を実行しようとすると前半部分の文字が消えてしまうようです。

    現在は1回の音声コマンドでまとめて行うときは、「テキストの選択」をエミュレートした0.1秒後に「Shift+変換」をエミュレートしているのですが、
    この0.1秒というのがWordPressとATOKの組み合わせにとっては速すぎるようです。(GmailとATOKの組み合わせだと問題なかったのでWordPressでも大丈夫なのかなと思ったら違ったようです。)

    この点については今後のアップデートでどうしようか検討してみます。
    この時間を0.1秒から0.3秒にすると、WordPressとATOKの組み合わせでもそれなりの文字数までうまくいくのですが、
    0.1秒でも問題ないケースの方が多いのでちょっとどうしようかなという感じです。

    一応僕のPCの場合は現在のバージョンで、WordPressとATOKの組み合わせでも4文字程度までは1回の音声コマンドでテキストの選択と変換を
    行えています。なので2、3文字程度の単語であれば1回の音声コマンドで選択と変換が出来ると思います。それ以上の文字数の場合はテキストの選択と「Shift+変換」を分けて使用してみてください。

    #70174 返信
    Avatar photoわいひら
    キーマスター

    それ以上の文字数の場合はテキストの選択と「Shift+変換」を分けて使用してみてください。

    承知いたしました。

    WordPressとATOKの組み合わせだと、
    「テキストの選択」と「Shift+変換」を2回の音声コマンドに分けて実行する場合は問題ないのですが、
    1回の音声コマンドでまとめて「テキストの選択」と「Shift+変換」を実行しようとすると前半部分の文字が消えてしまうようです。

    僕はこれまで前者で利用していたので、特に問題には気づきませんでした。
    今後とも2回に分けて使用したいと思います。

    正式版Ver.4.0.1も明日以降公開されれば、使用してみますね。

    #70203 返信
    Avatar photoわいひら
    キーマスター

    Sokki Voiceの最新版を使ってみました。
    しばらく使用してみたところ動作に大きな問題はありませんでした。

    ただ、僕はwindows 11を利用しているのですが毎回Sokki Voiceをアップデートするたびに以下のような警告メッセージが表示されます。

    Windowsの設定で非表示にはできるものの、デフォルトでこういった警告が出ることでせっかく素晴らしいソフトのSokki Voiceが、使ったことがない人からしたら「危ないソフトかも?」と思われるのはもったいない気がします。
    このSmartScreenの警告メッセージは、何か作者側で対応できないもんなんですかね。
    Windows10で現在SmartScreenを使用できませんが表示される時の対処法
    なんかアプリケーションのデータベースに関係することなので作者対応は難しそうな感じですよね。

    あと、僕は毎回タスクを右クリックして「音声認識ウインドウ」を非表示にしています(小さなボタンだけ表示状態)。

    ただ、Sokki Voiceを一旦閉じてまた開くと次回必ず「音声認識ウインドウ」が表示されて起動されます

    この「音声認識ウインドウ」の表示状態を次回起動時まで起動しておいて、次回は非表示のままでも表示されるように変更できないでしょうか。

    #70219 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    ■音声認識ON/OFFウィンドウをSokki Voice起動時に非表示にするには、
    詳細設定画面の「起動時の音声認識ON/OFFウィンドウ表示」の
    「表示有無とサイズ」でリストから「表示しない」を選択してください。

    また「ウィンドウ表示位置」のリストで「最後に表示した位置」を選択すると、
    Sokki Voiceを起動した時は非表示で、表示させたときは最後に表示した位置で表示できると思います。

    ■SmartScreenについては、コードサイニング証明書を購入して年間数万円支払えば表示できなくできるようです。

    後はダウンロード数が多くなるとSmartScreenが表示されなくなるという情報もありますが、どの程度のダウンロード数になればいいのかはよくわからないですし、アップデート直後はダウンロード数が少ないので結局は表示されてしまうような気がします。

    この点については今のところ現状のまま行こうかなと思ってます。

    #70220 返信
    Avatar photoわいひら
    キーマスター

    ■音声認識ON/OFFウィンドウをSokki Voice起動時に非表示にするには、
    詳細設定画面の「起動時の音声認識ON/OFFウィンドウ表示」の
    「表示有無とサイズ」でリストから「表示しない」を選択してください。

    そんなところに設定があったんですね。
    メインフォームの添付画像のところで設定が出来るのだと思っていました。

    思い通りのことができました。

    ■SmartScreenについては、コードサイニング証明書を購入して年間数万円支払えば表示できなくできるようです。

    今、そんなことになってるんですね…。
    あまり有名でないソフトでも出ないものがあるので、何かしら対策方法があるのかと思っていました。
    結構アコギな商売ですね…。
    年間数万円なんて、バカ高いのでそれだったら僕だったとしてもそのままにすると思います。

    #70221 返信
    みち
    ゲスト

    わいひら様

    ■メインフォームの設定項目は、ブラウザの音声認識画面に関する設定ですね。
    <p style=”text-align: left;”>Sokki Voiceを起動した時に自動で音声認識を開始するようにしたり出来ます。</p>
     

    ■SmartScreenの件はMicrosoft Storeからダウンロード出来るアプリだと警告メッセージが出ないとかもあるかもしれませんね。

    あとフリーソフトだと有料ソフトよりもダウンロード数がかなり多くなると思うので、警告メッセージが出にくくなるとかもあるかもしれませんね。

    このメッセージはアプリの起動前に表示されてるっぽいので、アプリの作り方でどうにかなるってものではなさそうです。

    #70225 返信
    Avatar photoわいひら
    キーマスター

    ■メインフォームの設定項目は、ブラウザの音声認識画面に関する設定ですね。

    そっちの方なのか…。
    設定が増えてくると、自分のようなたまにしか設定を変更しないライトユーザーにはどれがどれか分からなくなってしまいました。

    あとフリーソフトだと有料ソフトよりもダウンロード数がかなり多くなると思うので、警告メッセージが出にくくなるとかもあるかもしれませんね。

    ちなみに僕の作ったショボいソフトとかだとSmartScreenのダイアログが出るのでしょうか。
    http://netakiri.net/soft/memo.shtml#down
    最近Windows 11に変更した2台のパソコンでは、出た記憶はないのですが、自分の作ったソフトなので安全性は疑っておらず無意識に強制的に実行する方を選択したのかもしれません。

    #70226 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    そっちの方なのか…。
    設定が増えてくると、自分のようなたまにしか設定を変更しないライトユーザーにはどれがどれか分からなくなってしまいました。

    確かに最近は設定が増えてきて、ちょっと分かりづらくなってきた部分があるかなと思ってます。

    ■あと音声コマンド拡張設定で回数指定型のコマンドを有効にすると、

    「3文字削除」と発音 → backspaceを3回エミュレート

    「左を2回」と発音 → 左カーソルキーを2回エミュレート

    とかもできるので、まだ試してなければ使ってみてください。
    この回数指定型のコマンドは小説家の方からのリクエストで追加した機能なので文章を多く作る方にとっては結構便利なのではないかなと思います。

     

    ■わいひらさんが作成したソフト「チラシの裏」をダウンロードして起動してみましたら、SmartScreenの画面が表示されました。

    USBメモリなどでソフトを入れた場合はSmartScreenの警告は表示されないので、もしかしたらそういった方法で入れたのかもしれませんね。

    ちなみに僕の作ったショボいソフトとかだと・・・・

    いえいえそんなことはないです。とてもシンプルでとても良いソフトだと思いました。とにかく簡単に使えるところがいいですね。

    #70227 返信
    Avatar photoわいひら
    キーマスター

    おそらく、僕の場合設定した当時は動作を把握して設定しているんですけど、一度設定すると1ヶ月は再設定しないので、その間に忘れてしまうんだと思います…。

    ■あと音声コマンド拡張設定で回数指定型のコマンドを有効にすると、

    「3文字削除」と発音 → backspaceを3回エミュレート

    「左を2回」と発音 → 左カーソルキーを2回エミュレート

    すいません。この方法がよく分かりませんでした。

    拡張設定ダイアログを開いて「文字の選択、変換、削除、再入力」の画像の設定を入力するのでしょうか。

    その際の「音声コマンド」はどのように入力するのでしょうか。

    ■わいひらさんが作成したソフト「チラシの裏」をダウンロードして起動してみましたら、SmartScreenの画面が表示されました。

    おそらく自分のソフトなので、当たり前のように無意識に実行しちゃったんでしょうね…。
    いえいえ全然、現在のところSokki VoiceでIMEの再変換が使えないのが最大の問題点です。

    #70228 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    回数指定型のコマンドは、音声コマンド拡張設定の一番右側のタブで設定することができます。

    使用するコマンド、発音方法にチェックを入れると使えるようになります。

    #70241 返信
    Avatar photoわいひら
    キーマスター

    あぁ!そこタブになってるんでしたね!忘れていました。
    以前設定した時から何ヶ月か経って頭がリセットされると、一見、境界線が薄くてタブに見えなくて、単なる文字に見えていました。

    教えていただいた機能めっちゃ便利ですね。

    #70283 返信
    みち
    ゲスト

    わいひら様

    お世話になってます。

    あぁ!そこタブになってるんでしたね!忘れていました。
    以前設定した時から何ヶ月か経って頭がリセットされると、一見、境界線が薄くてタブに見えなくて、単なる文字に見えていました。

    確かに境界線が薄いですよね。僕も最初それが気になって少しいろいろいじってみたのですがうまくいかずに「とりあえずこのまま行ってみよっか!」って感じでそのままにしましたが、タブの境界をはっきりさせることができるかもう少し調べてみます。

    わいひら様が作成したソフト「チラシの裏」だと、
    ATOKとGoogle 日本語入力だと選択したテキストを変換することはできませんが、
    Microsoft IMEだと選択したテキストを変換することができました。

    なのでもしMicrosoft IMEを削除してないようでしたら、「チラシの裏」で音声入力する時はMicrosoft IMEを使用するというのも一つの手かもしれません。

    他にももう少し良い方法がないかちょっと考えてみます。

    #70284 返信
    Avatar photoわいひら
    キーマスター

    確か僕が最初に設定したときもタブ部分は「あーここか!」となった記憶があります。
    そして二回目は完全に忘れて分からなくなってしまいました…。

    僕はC#(.NET Framework と Win32 API)で作成しています(音声認識画面はJavaScript)

    以前上記のように書かれていましたが、これはVisual StudioのようなIDEを使用していないということでしょうか。

    わいひら様が作成したソフト「チラシの裏」だと、
    ATOKとGoogle 日本語入力だと選択したテキストを変換することはできませんが、
    Microsoft IMEだと選択したテキストを変換することができました。

    Microsoft IMEだと使えるんですね!
    僕はパソコンを触ってから、ほぼほぼATOKしか使ったことがないのですが今度試してみます。

    #70285 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    以前上記のように書かれていましたが、これはVisual StudioのようなIDEを使用していないということでしょうか。

    僕はVisual Studioを使っています。Win 32 APIに関してはDLLをインポートして使っています。

    後は再入力コマンドの改良版のIMEがオンで再入力できるようなコマンドがあったらどうでしょうか?

    同音異義語の部分をピンポイントで再変換できるわけではないので、選択したテキストを変換するよりは使い勝手が良くないような気もします。

    とりあえず簡単に作ってみた感じでは、「チラシの裏」でIMEがONの状態で前回入力した内容を再入力することはできました。

    #70300 返信
    Avatar photoわいひら
    キーマスター

    僕の環境でMicrosoft IMEで再変換を試したらうまくいきました。

    ■後は再入力コマンドの改良版のIMEがオンで再入力できるようなコマンドがあったらどうでしょうか?

    これは前回入力した音声入力が再度入力され、その後再変換状態になるということでしょうか。
    これはどういった状態のとき使用するのか今のところ明確なものは思いつかないです。
    とりあえず思いついたものは、入力したけど思い通りに変換されていなくて、削除がてら前回入力した文字列を選択して、IMEで変換できる状態で再入力するとかだったら確かに1日何回かは使用する可能性はあるかも。

    とりあえず簡単に作ってみた感じでは、「チラシの裏」でIMEがONの状態で前回入力した内容を再入力することはできました。

    これは僕の環境でも確認できました。

    #70301 返信
    Avatar photoわいひら
    キーマスター

    僕はVisual Studioを使っています。Win 32 APIに関してはDLLをインポートして使っています。

    一般的にVisual Studioで作成するのと「Win 32 APIはDLLをインポート」という状態がどう違うのかちょっと分かりませんが僕もVisual Studioで試してみました。

    最近こういうのは定番なのかやっぱ薄いですね…。

    プロパティで手軽に変換できそうなものもないんですね…。

    唯一DrowModeでOwnerDrawFixedにして自前で描画するという方法しかないっぽいですね…。

    ただDelphiもどのようになるか試してみたところ、同様にタブの区切りは薄い様でした。

    ただDelphiの場合はタブのスタイルを変更できるプロパティがありました。

    見た目は悪くなりますがこういうのがあると、やっぱ便利ですよね。

    #70302 返信
    みち
    ゲスト

    わいひら様

    ありがとうございます。

    僕の使っている開発環境でも、タブの表示を変更することができました。

    見た目はちょっと前のWindowsっぽい雰囲気もありますが、こっちの方がわかりやすいのでとりあえず次はこっちで行ってみようと思います。

    ■音声コマンドの拡張設定で以下の内容をできるようにしました(リストから選択)。

    ・{再入力IMEオン}
    変換できる状態で最後に入力した内容を再度入力するコマンド

    ・{[Back Space]×(前回入力した文字数)}→{再入力IMEオン}
    最後に入力した内容を削除して、変換できる状態で再入力するコマンド

    ※IMEがオンで音声入力がまともにできるのはATOKぐらいしかないのですが、Sokki Voiceを使ってるユーザーにはATOKを使ってる方が多いので入れておきます。

    ■音声コマンド拡張設定でのキーの操作と操作の間に0.1秒ごとの間隔を開けられるようにしました(カスタム設定から設定)。
    下の例の場合は「テキストを選択」した後に0.3秒の間隔をあけて「変換キー」をエミュレートします。
    {Shift+[←]×(前回入力した文字数)}→{0.1秒}→{0.1秒}→{0.1秒}→[変換]
    これでタイミングの問題でうまく機能しないケースに完璧ではありませんがある程度は対応できるかと思います。

    #70305 返信
    Avatar photoわいひら
    キーマスター

    DelphiのStyle的なプロパティがあったんですね。
    確かに見た目はちょっと古いかもしれませんが、それだとタブ選択できると間違いようがないのでユーザー的にはありがたいです。

    Microsoft IMEで再変換できるようになったんですが、Microsoft IMEを使うと今度は僕の使っているソフトキーボードで正常に入力できなくなってしまいました…。
    やっぱどうしてもATOKで再変換したいので、さっき突貫で「チラシの裏」のSokki Voiceで再変換できるバージョンを作ってみました。

    やっぱ再変換ができると使い勝手が全然違いますね。

    機能は簡素になりましたがこれだとATOKで再変換が出来るので僕の環境でSokki Voiceを使う上で死角はなくなりました。
    https://nelog.jp/wp-content/uploads/2022/10/chirashi.zip

    #70306 返信
    みち
    ゲスト

    わいひら様

    僕も先ほど新しいバージョンの「チラシの裏」をダウンロードして使ってみました。

    僕のパソコンでもATOKで選択したテキストの再変換ができることを確認できました。

    新しいチラシの裏では、IMEがONの状態で再入力するコマンドもちゃんと機能しました。

    それにしても、新しいバージョンのチラシの裏の作成あっという間でしたね。

    #70307 返信
    Avatar photoわいひら
    キーマスター

    ご確認ありがとうございます。
    昨日IDEを色々触っていたら、リッチエディットコンポーネントでATOKの再変換ができたので「こりゃ作るしかないだろ!」って感じになりました。
    チラシの裏はDelphiのチュートリアルで出てくるようなことしかやっておらず初心者でも簡単に作れるものなので比較的短時間で作成できました。

    ちなみに今回の「チラシの裏」はSmartScreenの画面は出ましたか?
    僕の場合出なかったんですけど同一パソコンにあるIDEでコンパイルしたものだったから出なかったのかな??

    #70308 返信
    みち
    ゲスト

    わいひら様

    今回もスマートスクリーンは表示されました。

    多分ダウンロードしたソフトに表示されるんだと思います。

    Sokki Voiceも自分のpcでコンパイルすると出ません。

    #70309 返信
    みち
    ゲスト

    わいひら様

    先ほどの続きですが、Sokki VoiceをコンパイルしたPCでコンパイルによってできたSokki Voice.exeではSmartScreenは表示されませんが、一旦ベクターにアップロードしてベクターからダウンロードしたSokki VoiceではSmartScreenが表示されました。

    ■次のアップデートで回数指定型のコマンドで、音声認識がうまくいかない場合の補助機能のようなもの追加しようと思ってます。
    僕が使ってる範囲ではうまくいかないのは、
    ・「3文字削除」が「3まで削除」となってうまくいかないケース
    ・「上を1回」が「夢を1回」となってうまくいかないケース
    が結構あるので、
    「まで」を「文字」として認識させる機能と、
    「上」を「夢」として認識させる機能(処理)をそれぞれチェックボックス形式でもうけるかたちにしようかと思ってます。。

    今のところは補正ケーブルのような形で一覧表で設定するところまでは考えていないです(結構ややこしくなりそうなので)

    わいひらさんの方では「回数指定型のコマンド」がこういう形でうまく実行されないとかありますでしょうか?

     

    #70310 返信
    みち
    ゲスト

    間違いました。

    「上」を「夢」として認識させる機能(処理)をそれぞれチェックボックス形式でもうけるかたちにしようかと思ってます。

    「夢」を「上」として認識させる機能でした。

    #70312 返信
    Avatar photoわいひら
    キーマスター

    多分ダウンロードしたソフトに表示されるんだと思います。

    確かにそうかもしれません。
    僕の使用しているソフト群も、パソコンが変わったらデータをLANで新しいパソコンに移動するだけだから、出ないのかも。
    どおりで自分の使っているソフトに出ないわけだ。これで腑に落ちました。

    わいひらさんの方では「回数指定型のコマンド」がこういう形でうまく実行されないとかありますでしょうか?

    10回に3回ぐらいはあるかもしれません。
    僕の滑舌が悪いだけなのかもしれませんが、短い単語だと結構誤認識してしまいますね。

    「夢」を「上」として認識させる機能でした。

    こういうケースは結構あるので、対応しだすと結構な数になるのかもしれません。

    #70316 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    こういうケースは結構あるので、対応しだすと結構な数になるのかもしれません。

    さしあたっては、下のダイアログの機能を追加したらだいぶ良くなりました(僕の場合)。

    あとそれでもうまく音声認識がうまくいかないケースに対しては、
    カスタム設定で{Shift+[←]×4}などのコマンドを設定できるようにして、カーソルキーなどを繰り返す処理をもう少し簡単に設定できるようにしようと思います。

    #70318 返信
    Avatar photoわいひら
    キーマスター

    なんかどんどん進化していきますね。
    次のバージョンが出たら試してみます。

    あと、今回の件とは関係ないけど「チラシの裏」の以下の点を修正しておきました。

    ・アイコンのライセンスを全てパブリックドメインに変更
    ・フォントの変更機能追加
    ・右クリック機能がないのに気づいたので追加

    https://nelog.jp/wp-content/uploads/2022/10/chirashi-1.zip
    これでほぼほぼ前のソフトと似たような使い勝手になった感じ。

    #70319 返信
    みち
    ゲスト

    <p style=”text-align: left;”>わいひら様</p>
    チラシの裏またダウンロードして使わせて頂きます。

    #70411 返信
    みち
    ゲスト

    わいひら様

    お世話になっております。

    チラシの裏(chirashi-2.0.3)を使ってみました。

    これはチラシの裏の不具合なのかどうかわかりませんが、

    Microsoft IMEでIMEがONの状態でテキストを入力したりキーボードを操作したりしていると結構な頻度でチラシの裏が落ちてしまいます(エディターに入力した内容は保存されません)。

    ATOKやGoogle 日本語入力だと全く問題がないので、Microsoft IMEの不具合かもしれません。

    僕は最近Windows UpdateでWindows 11 version22 H2にアップデートしたのでもしかしたらその影響もあるのかもしれません。

    僕はATOKやGoogle 日本語入力を使用すればそれで済むので特に大きな問題ではないのですが、Microsoft IMEしか使用しない人もいるかと思うので報告しておきます。

    異常が起きてもアプリが異常終了しないようにできますでしょうか?

100件の投稿を表示中 - 101 - 200件目 (全228件中)
返信先: Google音声認識を利用した他のWindows用ソフト
あなたの情報:




スポンサーリンク
レクタングル(大)広告
レクタングル(大)広告
NO IMAGE
この記事をお届けした
寝ログの最新ニュース情報を、
いいねしてチェックしよう!