ホーム › フォーラム › お問い合わせ・ブログや記事に関する質問など › Google音声認識を利用した他のWindows用ソフト
- このトピックには286件の返信、1人の参加者があり、最後に
により1ヶ月、 1週前に更新されました。
- 投稿者投稿
わいひら
キーマスターご連絡ありがとうございます。
僕の環境のMicrosoft IMEで試してみましたが今のところ異常終了はありません。
ソフトキーボードだから駄目なのかな…。
僕の使用しているTSKソフトキーボードとWindows標準のスクリーンキーボードで試してみましたが動作しているようです。
大体どれくらいの時間使用していると動作不良が出ますでしょうか?ちなみにこちらのダウンロードボタンのファイルでアップデートしても不具合が出ますでしょうか。
https://nelog.jp/chirashiわいひら
キーマスター不具合は再現されていないのですが今見ていたら、32ビットバージョンだったからかもしれません。
64ビットバージョンに変更したv2.0.5にアップデートしておきました。
以下のURLからダウンロードできます。
https://nelog.jp/chirashiみち
ゲストわいひら様
お世話になっております。
v2.0.5を試してみましたが、v2.0.3と同様にアプリケーションが落ちる現象が起こりました。
いろんな条件で試してみました(すべてMicrosoft IMEでテスト)。
結果は以下の通りです。■ハードウェアキーボードを使用した場合(ノートPCの標準キーボード)
発生頻度:すぐに起こる(IMEのオンオフを切り替えた時にほぼ必ず起こる)■ソフトウェアキーボードを使用した場合(Windows 11の標準のもの)
問題の現象は発生しない■Sokki Voiceで音声入力する場合
・テキストの入力では問題の現象は発生しない。
・仮想キーをエミュレートする場合、Shift+Enterをエミュレートする場合に発生する(僕の環境では必ず発生する)。
Enterキーのみのエミュレートでは発生しない。以上色々試してみた結果ですが、なんとなくMicrosoft IMEの不具合っぽい気がします。ネットで調べてみるとWindows 11のMicrosoft IMEの不具合は結構色々あるみたいです。
僕のPCでも、一度ハードウェアキーボードでテキストを入力している際にMicrosoft IMEの変換候補を表示するウィンドウが全く表示されなくなったことがありました(PCの再起動で復帰しました)。
わいひら
キーマスターこれは単にリッチエディットコンポーネントをおいただけのアプリになるのですが、これでも不具合は再現されますか?
https://nelog.jp/wp-content/uploads/2022/10/Project1.zipみち
ゲストわいひら様
これは単にリッチエディットコンポーネントをおいただけのアプリになるのですが、これでも不具合は再現されますか?
チラシの裏と同様の現象が再現しました。
僕はdelphiを使ったことはないのでちょっとよく分かりませんが、もしかしたらdelphiでコンパイルしたアプリとMicrosoft IMEのやり取りの中でエラーが起きてるのかもしれませんね。
C#だとtry catch finally でエラーが起きてもアプリを終了させずに済ませるようなこともできますが、そういったことは難しそうでしょうか?
みち
ゲスト[追加情報]
Visual Studioで(WindowsFormsアプリ)のリッチテキストボックスを置いた簡単なアプリの場合は、同じような現象は起こりませんでした。
わいひら
キーマスターご確認いただきありがとうございます。
僕はdelphiを使ったことはないのでちょっとよく分かりませんが、もしかしたらdelphiでコンパイルしたアプリとMicrosoft IMEのやり取りの中でエラーが起きてるのかもしれませんね。
やっぱそれっぽいですよね。
Delphiが悪いのかMicrosoft IMEが悪いのかはちょっとわからないですけど。C#だとtry catch finally でエラーが起きてもアプリを終了させずに済ませるようなこともできますが、そういったことは難しそうでしょうか?
Delphiでも同じような例外処理はあるのですが、さっきのテストプログラムと同じで「チラシの裏」のリッチエディットのイベントには全く何もコードを書いていないんですよね…。単にコンポーネントをそのままおいて使用しているだけ。
これがOnKeyPress, OnKeyUp, OnKeyDownのイベントに何かコードを書いていると言うなら今すぐにでも対応可能なんですが。みち
ゲストわいひら様
Windows 10のPCでも試してみました。
Windows 10ではMicrosoft IMEを使用してもチラシの裏は落ちませんでした。僕のWindows 11のPCでは、Sokki VoiceでMicrosoft IMEを使用してShift+Enterをエミュレートすると今のところ100%問題の現象が起こります。
わいひら様のWindows 11のPCではどうでしょうか?わいひらさんのWindows 11で問題の現象が起こらないのであれば、Windows 11の中でも限られた環境の中でしか問題の現象は起きないのかもしれませんね。
これがOnKeyPress, OnKeyUp, OnKeyDownのイベントに何かコードを書いていてそれに対応するという事なら今すぐにでも対応可能なんですが。
確かに自分でソースコードに何も書いてない部分のエラーについてはエラー処理の書きようがないですね。
わいひら
キーマスターWindows 10では大丈夫なんですね。
だとしたら大半の環境では大丈夫そうですね。わいひら様のWindows 11のPCではどうでしょうか?
明日、車椅子に乗ったら実際のキーボードを使うWindows 11パソコンを利用するので、その時に試してみます。
不具合を再現するなら例えば日本語入力でAキーをおしっぱなしとかでいいんですかね。
それとも適当な日本語を数百文字程度打って見るのが良いのか。
いずれにせよ、色々試してみます。みち
ゲストわいひら様
左上にある「半角/全角」 のキーが確率が高いですね
わいひら
キーマスターすいません。
今日訪問歯科で寝てなければいけないのを忘れていました。
明日試します。昨日、Cocoonフォーラムの方にもお聞きしてみたのですが、Windows 10だと問題ないみたいですね。
https://wp-cocoon.com/community/postid/65509/
ただいずれにせよ、Microsoft IMEは不安定みたいですね…。わいひら
キーマスターちなみにこっちのファイルだと不具合は出ますか?
https://nelog.jp/wp-content/uploads/2022/10/project1.zip
こっちはLazarusと言う別のDelphiのIDEで作ってみました。みち
ゲストわいひら様
ちなみにこっちのファイルだと不具合は出ますか?
https://nelog.jp/wp-content/uploads/2022/10/project1.zip
こっちはLazarusと言う別のDelphiのIDEで作ってみました。Windows 11 Microsoft IMEでは同じく不具合が発生しました。
Windows 10のMicrosoft IMEとWindows 11のMicrosoft IMEは名前こそ同じですが、機能的には全然別のソフトって感じがしますね。
わいひら
キーマスタークロスプラットフォーム環境のLazarusで問題が出るのだとしたら、ちょっと対応のしようがないのかもしれませんね。
僕の環境のWindows 11+Microsoft IMEで試した限りでは、特に問題はないようです。
結構色々しているのですが、固まってしまうといったことはありません。Microsoft IMEの設定で「互換性」の設定で「以前のバージョンのMicrosoft IMEを使う」にしても同様の症状が出ますでしょうか。
みち
ゲストわいひら様
Microsoft IMEの設定で「互換性」の設定で「以前のバージョンのMicrosoft IMEを使う」にしても同様の症状が出ますでしょうか。
以前のバージョンのMicrosoft IMEを使った場合は、Windows 11でも問題の現象は発生しませんでした。
僕のWindows 11は最近version 22H2にアップデートしましたが、わいひらさんのWindows 11のバージョンも同じでしょうか?
僕のPCに何かチラシの裏と相性の悪いアプリでもインストールされてるのかな?
いずれにせよ、問題が発生しないPCの方が多いようならそこまで気にしなくてもいいかもしれませんね。
僕に関して言えば、Google 日本語入力もしくはATOKを使用すればいいだけなのでそんなに問題はありません(最近ATOKを購入しました。)。
大変お手数をおかけしました。
わいひら
キーマスター僕の環境も最新のWindows 11にアップデートして試しましたが、具合を再現しないようです。
不具合発動のトリガーは何なんでしょうね…。みち
ゲストわいひら様
不具合が再現するPCが少ないにこした事はありませんね。
僕のPCでも「以前のバージョンのMicrosoft IME」にすれば不具合は起こりませんし、回避策もあるのでとりあえずは大丈夫じゃないでしょうか。
一応参考までに、
イベントビューアーのエラーログと僕のPC環境になります(ハードウェアも関係しているかもしれないので)。【イベントビューアーのエラーログ】
障害が発生しているアプリケーション名: chirashi.exe、バージョン: 2.0.6.20、タイム スタンプ: 0x63541760
障害が発生しているモジュール名: textinputframework.dll、バージョン: 10.0.22621.608、タイム スタンプ: 0x241995fd
例外コード: 0xc0000090
障害オフセット: 0x0000000000003e7f
障害が発生しているプロセス ID: 0x0x25A0
障害が発生しているアプリケーションの開始時刻: 0x0x1D8E9F893F3EEB8
障害が発生しているアプリケーション パス: C:\Users\kashi\OneDrive\デスクトップ\chirashi\chirashi.exe
障害が発生しているモジュール パス: C:\WINDOWS\SYSTEM32\textinputframework.dll
レポート ID: e5a4c490-1bd8-4769-a1d7-f5627495da75
障害が発生しているパッケージの完全な名前:
障害が発生しているパッケージに関連するアプリケーション ID:【僕のPC環境】
dynabook
デバイス名 LAPTOP-3L4S4QJ4
プロセッサ Intel(R) Core(TM) i5-8265U CPU @ 1.60GHz 1.80 GHz
実装 RAM 8.00 GB (7.77 GB 使用可能)
システムの種類 64 ビット オペレーティング システム、x64 ベース プロセッサ
ペンとタッチ このディスプレイでは、ペン入力とタッチ入力は利用できませんエディション Windows 11 Home
バージョン 22H2
インストール日 2022/10/17
OS ビルド 22621.675
エクスペリエンス Windows Feature Experience Pack 1000.22634.1000.0わいひら
キーマスター詳細な情報をありがとうございます。
textinputframework.dllで検索したら、完全に同じ症状のものが出てきました。
[半角/全角]キーを押すとクラッシュする
https://www.haijin-boys.com/discussions/6742
IMEのバージョンによっては日本語入力で落ちる? (フォーラム)https://www.haijin-boys.com/discussions/6641これは、Meryと言うエディターの作者さんのサイトなんですが、調べてみたらDelphiで開発しておられる模様。
https://www.haijin-boys.com/software/mery/mery-2-5-4で、結論から言うとDelphiかMicrosoftの対応待ちとなりそうです。
Delphi の開発元 (エンバカデロ) も問題を認識しているようですが、以下のような見解を出しておられるようです(以下はWindows 10のものですが)。VCLコントロールは、Windows標準コントロールのラッパークラスであるため、その挙動は実行しているWindowsバージョンに依存いたします。IMEの挙動も同様に選択しているIMEの種類(例えば、MS IMEなど)の動作に依存いたします。
エンバカデロでは、今後もIMEに影響する動作に関しては、VCL側で特定のバージョンに合わせて独自の対処コードを埋め込む方針ではなく、基本的にWindows OSおよびIMEの修正によって対処すべきと判断しております。
フォーラムにてMeryの作者さんは何かしら対応策を見つけられたようですが、詳細が書かれていないので修正方法まではちょっとわからなかったです。
DelphiかMicrosoft IME何かが悪いのは間違いなさそうですが、対応を待つしか僕にはできないかもしれません。みち
ゲストわいひら様
Microsoft IMEのフィードバック Hubを確認したら、
「Mery などいくつかのアプリで日本語IMEを使用中に半角/全角キーを押下するとアプリがクラッシュする」という内容で問題が提出されていました。
マイクロソフトからの返信では、
報告していただいた問題は、ビルド 22616 で修正されました。ビルドを更新してお試しください。更なる修正が必要な場合には、新しいフィードバックを送ってお知らせください。
となっていますが、それより新しいOS ビルド 22621.675(僕のPC)でまだ不具合が発生するので「類似したフィードバック」でエラーログをマイクロソフトにフィードバックしておきました。
他の方のコメントで「Dev channel では発生しない」とありますが、それが不具合修正で発生していないのか、それともたまたま発生していないのか、その辺はちょっと分からないですね。
わいひら
キーマスターフィードバックしていただきありがとうございます。
同じビルドでも僕の環境だと不具合が発生しないのも謎ですね…。わいひら
キーマスター今見てみたらWindows 11 Proで新しいビルドが出ていました。
エディション Windows 11 Pro
バージョン 22H2
インストール日 2022/10/29
OS ビルド 22621.755
エクスペリエンス Windows Feature Experience Pack 1000.22636.1000.0上記のビルドで確認したらMicrosoft IMEの不具合が再現しました…。
ProとHomeでも違うのかもしれませんね。みち
ゲストわいひら様
<p style=”text-align: left;”>僕のPCはProではなくHomeエディションなんですが、不具合出てます。</p>
何が原因なんでしょうね?微妙なタイミングの問題とかだとPCの処理速度とかも関係してくるかもしれませんよね。
不具合修正する方にとっては厄介な不具合ですね。
みち
ゲストわいひら様
先日ベクターにSokki VoiceのVer.4.1.0の公開申請をしました。
特に問題がなければ12月7日水曜日の夕方頃にはダウンロードできるようになってると思います。主な変更内容は、
①回数指定型コマンドの誤認識対策機能(回数指定型コマンドのタブから開く)
②回数指定型 カスタム設定機能の追加(音声コマンド拡張設定の新しいタブ)
上の表のように*を使用して任意の回数(1~50)キーボード操作を繰り返すことができるコマンドも用意しました。
*を使用せずに、
{[Del]×3}のように繰り返す回数を限定したコマンドを設定することもできます。わいひら
キーマスター書き込みに気づいてませんでした。
アップデートして使ってみますね。わいひら
キーマスター遅くなりました。
アップデートして試してみました。
①に関してはあまり上コマンドを使わないので、使用実感はちょっとよく分かりませんでした。
②は登録してみて正常に実行できました。みち
ゲストわいひら様
①に関しては、その人の発音とかによって誤認識されやすい言葉が違ってくるのかもしれませんね。
②を使って、よく誤認識される言葉に対して実行したい音声コマンドを登録することでも誤認識対策ができるかと思います。
わいひら
キーマスターそんなこともできるんですね。
Sokki Voiceのこの一年のアップデートは凄まじいものがありました。頭が下がります。
私のようなライトユーザーでは表面的な機能しか利用できていないかもしれませんが、Sokki Voiceにはこの一年本当にお世話になりました。
素晴らしいソフトとみちさんのご尽力に感謝です。本年は色々お世話になりました。ありがとうございます。
良いお年をお迎えください。みち
ゲストわいひら様
新年あけましておめでとうございます。
今年もよろしくお願いいたします。こちらこそ昨年度は大変お世話になりました。
寝ログにSokki Voiceを取り上げていただきありがとうございました。
寝ログに取り上げていただいた影響はとても大きかったです。Sokki Voiceについては概ね僕の作りたかったソフトにかなり近づいてきました。
今年はSokki Voiceのアップデートについてはちょこっとした機能追加や見つかった不具合に対する修正がメインになると思います。僕も今年はそろそろ別のジャンルのプログラミングにも手をつけたくなってきました。画像編集とかAIに関するプログラミングとかその辺にトライしてみようと思っています。
みち
ゲストわいひら様
お世話になっています
音声コマンドで音声認識する言語を切り替える機能を追加したバージョン、
Ver.4.2.3をベクターから公開しました。日本語から英語に切り替えるときは音声コマンドは日本語でいいのですが、英語から日本語に切り替えるときは音声コマンドを英語の発音にする必要があります。
■あとSokki Voiceとは関係ないのですが、
ローカルで音声認識できるVoskというAPIがあって今それを試しています、この投稿もVoskを使用して投稿しています。C# でデスクトップアプリとして音声認識した内容を他のアプリに入力するところまでは作ってみました。
音声認識の変換精度はグーグルの音声認識ほどではないですがそれなりの変換精度だという印象です。ただグーグルの音声認識に比べるとノイズに弱いのと発音していないのに「えーと」と入力されてしまうことがあるのでいろいろ調整する必要があります。
まあ、この辺は調整でなんとかなりそうですが、
一番残念なのは.NetFrameworkで使用できない所です、C#でVoskを利用したアプリを作成した場合、そのアプリをウィンドウズで使うには.Net5などのフレームワークをインストールする必要があるのでちょっと気軽に試すことができないというのが一番残念です。レスポンスについては僕のPCではGoogleの音声認識より少し遅いです。レスポンスについてはローカルで動く音声認識なのでもろに使用するパソコンのスペックが効いてくるような気がします。
Voskには誰が話しているかを識別するような機能もあるみたいなので議事録の作成などには向いているのかもしれません。
もう少しいろいろ使ってみてからVoskについてブログを書いてみたいと思います。
わいひら
キーマスター書き込みされているのに気付いておりませんでした。。
かなり遅ればせながら明けましておめでとうございます。
Sokki Voiceの新しいバージョンも試してみたいと思います。最近音声認識と言ったら「Whisper」も話題ですね。
https://gigazine.net/news/20220922-openai-whisper-speech-recognition/
ただこちらはほとんど「文字起こし」と紹介されているものばかりなんで音声入力で使うのは難しいんですかね…。
https://www.youtube.com/results?search_query=whisper+ai
これで普通に音声入力できればかなり強力そうなんだけど。みち
ゲストわいひら様
確かにWhisperは気になりますね。
僕の調べた感じではWhisperは基本的にはリアルタイムの音声認識には対応してないようです。
マイクからの入力自体はできるみたいですが、ある一定の時間で区切ってその時間ごとに音声をテキストに変換する感じになりそうです。
このやり方だとタイムラグが気になるようになると思います。
あと短い文章だとWhisperの強みを発揮できないかもしれませんね。マイクからの音声をテキストに変換するアプリを作成している方もいるようです。
実際に試している様子も紹介されています。わいひら
キーマスター僕の調べた感じではWhisperは基本的にはリアルタイムの音声認識には対応してないようです。
そうなんですね。
精度がかなり高そうなだけに、リアルタイムに対応してなさそうなのは残念です。マイクからの入力自体はできるみたいですが、ある一定の時間で区切ってその時間ごとに音声をテキストに変換する感じになりそうです。
確かに、長い文章を一気に読み込んで、その文脈を解析することで高い精度を出しているのかもしれませんね。
リンク先を見る限りでは今のところは全然Google音声認識の方が良さそうですね。みち
ゲストわいひら様
オフラインで音声認識できるVoskを用いたWindows用のデスクトップアプリ(テスト用アプリ)を作成して、音声認識の変換精度やレスポンス、実際にVoskを使ってブログが書けるか等色々試してレビューしました。
興味があれば読んでいただければと思います。Voskは結構いい感じの音声認識APIでした。
オフラインで音声認識できるVoskを用いたWindows用アプリ | ソフト&アプリ工房 サークルロード (circle-road.com)
みち
ゲストわいひら
キーマスターVoskに関する詳細なレポートありがとうございます!
Voskも優秀そうなんですが、オンラインに送信されるということを気にしないのであればGoogleの方が使い勝手が良さそうな感じですね。
クライアントだけで動作させるには1 GBの辞書とか.NET6とか必要ですが、本来クライアントで処理させようとしたらそのぐらいいろいろ必要になりますよね。
その点Google(Sokki Voice)はChromeがあれば良いので、始めやすく使い勝手がいいんですね。みち
ゲストわいひら様
Web Speech API 以外にも音声入力アプリに使える音声認識APIを確保しておきたかったので、そういった意味でVoskが良いAPIで良かったです。
あとSokki Voiceの音声認識を開始を音声コマンドから行いたいという方が数名いて、そういった事も今回Voskを試した理由の一つです。
Sokki Voiceの中にVoskを組み込む事はしないと思いますが、50MBのモデルを使った別アプリからSokki Voiceの音声認識をスタートできるようにするというような使い方はするかもしれません。
わいひら
キーマスターあとSokki Voiceの音声認識を開始を音声コマンドから行いたいという方が数名いて、そういった事も今回Voskを試した理由の一つです。
これ僕もその一人です。
現時点で音声認識で終了ってできるんでしたっけ?あと最近使っていて思ったんですけど、補正テーブルの編集時、セルを選択したらキャレット点滅状態のセル編集可能な状態になると嬉しいです。
もしそれで何かしらの不具合が出るのだとしたら、せめてキャレット点滅状態にならなくてもCtrl+Vもしくは、右クリックメニューで貼り付けができるとありがたいです。わいひら
キーマスターあと音声認識を無効にして一定時間が経った後、音声認識を再び有効にした際、新しくChromeのタブが作成されてしまいます。
これを新規作成させないで常に同じタブを利用するということはできませんでしょうか。みち
ゲストわいひら様
あと最近使っていて思ったんですけど、補正テーブルの編集時、セルを選択したらキャレット点滅状態のセル編集可能な状態になると嬉しいです。
編集中にセルを選択した時にキャレット点滅状態にする方向で検討してみます。
ATOKだけキャレット点滅状態にしないと補正テーブルに音声入力できないんですね。Microsoft IMEやGoogle 日本語入力はキャレット点滅状態にしなくても入力できるのにちょっと不思議です。これ僕もその一人です。
現時点で音声認識で終了ってできるんでしたっけ?音声コマンドで音声認識の停止はできます(拡張設定のリストから選択)。
あと音声認識を無効にして一定時間が経った後、音声認識を再び有効にした際、新しくChromeのタブが作成されてしまいます。
これを新規作成させないで常に同じタブを利用するということはできませんでしょうか。この点に関しては、Sokki Voice.exeと音声認識画面(Google Chrome)の接続が途切れてるために起こっているのだと思います。(Google Chromeの2月頃のアップデートが関係してるかもしれません。)
Google Chromeの設定の「パフォーマンス」の項目で、「メモリーセーバー」と「省エネモード」をオフにしてみて試してみてもらってもよろしいでしょうか。
もしGoogle Chrome に上記の設定が表示されない場合は下記の二つのフラグをオンにすることで表示することができるようです。
chrome://flags/#battery-saver-mode-available
chrome://flags/#high-efficiency-mode-availableわいひら
キーマスターATOKだけキャレット点滅状態にしないと補正テーブルに音声入力できないんですね。Microsoft IMEやGoogle 日本語入力はキャレット点滅状態にしなくても入力できるのにちょっと不思議です。
これはATOKだけの現象だったんですね;
確かにATOKだとそんな状態になります。
ありがとうございます。Google Chromeの設定の「パフォーマンス」の項目で、「メモリーセーバー」と「省エネモード」をオフにしてみて試してみてもらってもよろしいでしょうか。
承知いたしました。
後で試してみます。みち
ゲストわいひら様
メモリーセーバーと省エネモードをオフにしても変わらないようでしたら教えていただけたらと思います。
あと最近使っていて思ったんですけど、補正テーブルの編集時、セルを選択したらキャレット点滅状態のセル編集可能な状態になると嬉しいです。
こちらについてちょっと試してみました。
セルを選択したときにATOKでもすぐ音声入力できる状態にできました。ここで一点確認したいのですが、以下の二つの状態であったらどちらがよろしいでしょうか。
1.すでに入力されているテキストが選択されている状態(音声入力すると古いテキストが消えて新しいテキストに上書きされる)
2.すでに入力されているテキストの後ろにキャレットがある状態(音声入力すると古いテキストの後ろに新しいテキストが追加される)
僕は1番目の方が使い勝手が良さそうなので、1番目の方にしようと思っていますがいかがでしょうか。
わいひら
キーマスターメモリーセーバーと省エネモードをオフにしても変わらないようでしたら教えていただけたらと思います。
こちら現在試し中ですのでしばらくお待ちください。
僕は1番目の方が使い勝手が良さそうなので、1番目の方にしようと思っていますがいかがでしょうか。
僕も断然1番です。削除したい時はバックスペースなどですぐにけせて、追加入力したい場合は→キーを1回押して即座に入力できるようになるからです。
みち
ゲストわいひら様
僕も断然1番です。削除したい時はバックスペースなどですぐにけせて、追加入力したい場合は→キーを1回押して即座に入力できるようになるからです。
承知しました。
キーワード入力と音声コマンド(拡張設定も)についても同じようにしておきます。
あと、僕のPCでもメモリセーバーをオンにして2時間位放置していたらSokki Voice.exeと音声認識画面の接続が途切れました。
接続が切れている時はマイクの色は青になります。黒と赤は接続している状態です
わいひらさんの環境でも大体同じ位の時間で接続が切れるのでしょうか?
※接続が切れてる時のマイクの色は青です。黒と赤は接続している状態です。
わいひら
キーマスターメモリーセーバーと省エネモードをオフにしたら、無駄なタブができてしまうのはかなりましになりました。
ありがとうございます。
ただ一度接続が切れたタブの繋ぎ直しってできないんですよね?あと、僕のPCでもメモリセーバーをオンにして2時間位放置していたらSokki Voice.exeと音声認識画面の接続が途切れました。
僕も以前はそんな感じでした。
その度に新しいタブが開かれていたのでかなり閉じるのは億劫になっていました。
今は機能を無効にしたのでかなり改善されました。-
この返信は2年、 1ヶ月前に
わいひらが編集しました。
みち
ゲストわいひら様
ただ一度接続が切れたタブの繋ぎ直しってできないんですよね?
接続が切れたタブは実際には、メモリがクリアされた状態になってるんだと思います。なので見た目の上では音声認識画面が開かれてますが、実質的にはGoogle Chromeに音声認識画面が閉じられた状態という方がいいのかもしれません。
現在のプログラムはSokki Voice.exeと音声認識画面の間で何かしらイレギュラーな事が起こって接続切れた場合は、再接続するようにしています。
なので途切れっぱなしなのは、メモリーがクリアされているのだと思います。
僕の方でメモリがクリアされないようにできるかどうかは、その点にはあまり踏み込んでないので現時点では分からないです。
ちなみにメモリセーバーをオフにしてもまだ接続が途切れる事があるんでしょうか?
■あとメモリセーバーの項目で、常にアクティブにするサイトに音声認識画面を登録したらどうでしょうか。もっと改善されたりしないでしょうか?
わいひら
キーマスターわいひらさんの環境でも大体同じ位の時間で接続が切れるのでしょうか?
僕の環境でも近い間隔だったと思います。
ちなみにメモリセーバーをオフにしてもまだ接続が途切れる事があるんでしょうか?
稀にあります。
しかしメモリーセーバーをオフにした状態と比べたら1/20くらいになったような感覚です。接続の繋ぎ直しなどは難しい感じなんですね。
とはいえ前回書き込んだ時は、メモリーセーバーが有効な状態であまりにもひどかったので書いてしまいました…。
現在は、そこまで気にならないほど接続は切れないようになりました。
なので現在の間隔で言えば無理してなおすほどのものでもないかもしれません。みち
ゲストわいひら様
現在は、そこまで気にならないほど接続は切れないようになりました。
なので現在の間隔で言えば無理てなおすほどのものでもないかもしれません。
許容範囲内と言う事で良かったです。
この辺についてはGoogle Chrome自体の動作を安定させる側面もあると思うので、Google chromeの設定で問題をある程度回避できるのであれば、その方が良いように思ってます。
問題をフィードバックしていただきありがとうございました。
みち
ゲスト先ほどの投稿で、書き忘れましたが追加した機能の詳細については詳細は付属の「SokkiVoice Ver.4.2.3からの変更点.pdf」にてご確認ください。
みち
ゲスト前々回の投稿がうまく投稿できていなかったようです(文が長すぎたせい?)。
リクエストもあった機能(補正テーブルや音声コマンドのセルを選択した時にすぐ入力できるようにする)を盛り込んだSokki Voice Ver.4.3.0を僕のウェブサイトにアップロードしました。
https://circle-road.com/?wpdmpro=sokki-voice-ver4-3%e8%a9%a6%e4%bd%9c%e7%89%88
ダウンロードに必要なパスワードは
201382
になります。
あと今回のアップデートで音声認識オンオフのショートカットキーをソフトウェアキーボードからも利用できるようになっていると思います(うまくいかない環境もありますが)。よかったら試してください。
詳細は付属の「SokkiVoice Ver.4.2.3からの変更点.pdf」にてご確認ください。
わいひら
キーマスター早速最新版を試してみました。
新機能全てを試してはいませんが、僕が最も使用しそうなホットキーによるソフトキーボードのオン/オフを試してみました。
Trail Soft Keyboardというソフトキーボードで試してみたところ、普通のソフトキーボード操作では動作しませんでした。
けれどホットキーを一旦マクロに登録してそのマクロを実行すれば動作しました。
これは以前のバージョンではできなかったので、今回の機能追加のおかげでソフトキーボードからオンオフを切り替えられるようになりました。
ありがとうございます!みち
ゲストわいひら様
お世話になっております。
音声でSokki Voiceの音声認識のオンオフを切り替えるためのツールをアップロードしました。もしよろしければ使ってみて下さい。
このツールは下記のリンクからダウンロードすることができます。
https://circle-road.com/?wpdmpro=tool-for-sokki-voice-ver1-0ダウンロードに必要なパスワード:
201382このソフトは、
・.NET 6 (.NET Runtime)がインストールされている PC である必要があります。
・また利用する他のアプリケーションによっては本ソフトウェアで送信したショー
トカットキーが Sokki Voice 側でうまく検出されない可能性があります。
Sokki Voice 側でのショートカットキーの検出率を上げるために 10 回連続でショートカットキーを送るようにしました(Sokki Voiceは200msec以内であればショートカットキーを1回しか受け付けないようにしているので)。
僕のPCでは起こった事は無いですが、もしかしたらまれに音声認識の ON/OFF が切り替わった後すぐに元に戻る事があるかもしれません。今回はプロセス間のやり取りについて一番手っ取り早く、リスクの小さいショートカットキーのエミュレートを採用しました。これで問題がありそうなら違う形のプロセス間通信を検討します。
このツールに関する詳細と.NET 6 (.NET Runtime)のインストールについては同梱のPDF(Tool for Sokki Voice取扱説明書.pdf)をご確認ください。
わいひら
キーマスターご連絡ありがとうございます。
僕の保有している2環境で試してみました。
結果は以下のような感じでした。環境A:音声入力がオンにならない
環境B:音声入力オンは何度か成功。ただ成功する時は連続して成功するが、失敗する時は何度も失敗する。アプリがアクティブでない時成功率が低い気がする。アプリがアクティブだった時でも失敗する時は失敗する。こんな感じでした。
わいひら
キーマスターアプリがアクティブ/アクティブでない関係なく、環境Bの成功率で言うと40%ぐらいでたまに成功すると言った感じです。
わいひら
キーマスターあとこれはGoogle認識側の仕様変更だと思いますが、Sokki Voiceの入力オプションを一言モードにしていたとしても、返ってくるまでの時間が長くなったように感じます。
あと少し音声入力の癖も変わったような…。前は○○と発声したら高確率で△△と変換されていたものが、時期を境に□□と変換されるようになってしまったみたいな。
2、3ヶ月前くらい前からだったような気もしますが、みちさんの環境ではそういった現象はないでしょうか?みち
ゲストわいひら様
音声でのオンの成功率の件了解しました。やっぱり環境にかなり依存するんですね。
プロセス間通信を検討するか、あるいはSokki Voiceに組み込むかなど検討してみます。
とりあえずはこの機能をリクエストした方のところでは問題なかったみたいなので最低限のラインはクリアしたという感じです。
ちなみに、詳細設定画面のショートカットキーに関する設定で、「以前のバージョンの方法で検出する(互換性)」のチェックは外れている状態でしたでしょうか。
このチェックが入っていると成功率がすごく下がると思います。
■あとGoogleの音声認識に関しては、僕の環境でもかわりました。時間に関しては、ノイズが多い時に時間がかかるようになった気がします。
静かな環境ではそんなに変わらない気もしますが、ちょっと遅くなったような気もする、という感じです。
変換結果に関しては、明らかに変わりました。語彙は前よりも少なくなった気がします(特に専門用語)。
ただ以前はなんでこんな間違いをするんだろうというのが、時々ありましたがそういうのは減った気がします。
みち
ゲストわいひらさんの方では、認識結果が返ってくるまで時間は結構かかる感じでしょうか?
僕の印象ではテキストへの変換が遅くなったというよりも、暫定の結果から最終結果に確定するまでに時間がかかるようになったって気がします。
なのでもしかすると、マイクのボリュームを下げる等で、雑音を拾いにくくしてGoogleの音声認識エンジンが発声が終わった事を認知しやすくすると多少違うかもしれないです。
というのも、僕は外付けのマイクが2つあって、音を拾わない方のマイクを使った時はすぐに認識結果が返ってきてたような気がします。
もしあまりヒドイようなら、タイムアウトを設けて、タイムアウトになったら暫定の結果でテキストを入力したりするオプションの追加を検討します。
わいひら
キーマスターちなみに、詳細設定画面のショートカットキーに関する設定で、「以前のバージョンの方法で検出する(互換性)」のチェックは外れている状態でしたでしょうか。
はい。そこはマニュアルにも書かれていたので何度も確認しました。
変換結果に関しては、明らかに変わりました。語彙は前よりも少なくなった気がします(特に専門用語)。
僕の場合、以前は「くてん」で「。」と高確率で出ていました。
しかし違和感を感じてからは体感70%で「くてん」変換で「楽天」と出てしまうようになりました。わいひらさんの方では、認識結果が返ってくるまで時間は結構かかる感じでしょうか?
早い時は早いですが遅い時は遅いです。下手すると10秒以上かかっているような気がします(言葉の選択に迷っている時結構かかっているような気がする)。
前は「一言モード」だと早い体感はあったのですが今や「標準モード」とそう変わらないような気がします。
下手したら「標準モード」の方が早いんじゃないかと思うほどです。
なので今は「標準モード」で使用しています。僕の印象ではテキストへの変換が遅くなったというよりも、暫定の結果から最終結果に確定するまでに時間がかかるようになったって気がします。
僕もそんな感じかも。
ダイアログが出てから結構長く感じるようになりました。なのでもしかすると、マイクのボリュームを下げる等で、雑音を拾いにくくしてGoogleの音声認識エンジンが発声が終わった事を認知しやすくすると多少違うかもしれないです。
今度遅いと感じる時はやってみます。
わいひら
キーマスターあと、今日久々に補正テーブルを編集したら最新バージョンで入力の仕様が以下のように変更されていることを確認しました。
あと最近使っていて思ったんですけど、補正テーブルの編集時、セルを選択したらキャレット点滅状態のセル編集可能な状態になると嬉しいです。
余計な動作が一つ減ってとても使いやすくなりました。
ありがとうございます。みち
ゲストわいひら様
句点→楽天 教えて頂きありがとうございます。確認してみます。
でもこれはちょっとやっかいですね。
「楽天」を「。」に置き換える処理を入れると、いざ楽天と入力したい時に「。」となってしまうので、ちょっと悩ましいですね。
■音声認識にかかる時間について
標準モードは前よりも早くなったと思います。あと僕のPCでも標準モードは極端に時間がかかる事が少ないです。
標準モードと一言モードを何度か比較してみると、スムーズな時は一言モードの方がちょっと速いです。
なので一言モードの時にタイマーを設定しようと思います。
今考えているのは、暫定の結果が1秒以上更新されない時はその時点で認識結果を取得してアプリに入力したり音声コマンドを実行するようなオプション(デフォルトで有効)を入れようと思います。
わいひら
キーマスターそうなんですよ。
楽天はブログを書くとき結構使う言葉なんで、これを辞書で変換しちゃうと困っちゃうんですよね。標準モードは前よりも早くなったと思います。あと僕のPCでも標準モードは極端に時間がかかる事が少ないです。
僕も以前より早くなったように感じます。
これだけ早くなったら「もう標準モードの方がいいや」てな感じで今は標準モードばかり使ってます。みち
ゲストわいひら様
僕のPCで昨日何度か連続して「句点」と発音して試してみましたが、僕の環境では認識結果は全て「句点」となりました。
Google音声認識結果は経時変化がある感じがします。
ただ2ヶ月位前からの変化は、経時変化というよりも音声認識モデルを変更したという感じです。
省エネとかなのか、新しい音声認識のテストをしてるのか、結構変わりましたね。
みち
ゲストわいひら様
音声認識を確定させるためのタイマー機能(デフォルトでオン)を追加したバージョンのSokki Voice Ver.4.3.1を僕のウェブサイトにアップロードしました。
あと補正テーブルと音声コマンド拡張設定に検索機能を追加しました。
もしよければ使ってみてください。
下記のリンクからダウンロードできます。
ベクターから今後公開するバージョンを先行して僕のサイトからダウンロードできるようにしただけなので、今回はダウンロードにパスワードは必要ありません。https://circle-road.com/?wpdmpro=sokki-voice-ver-4-3-1
タイムアウトを設けたので、標準モードよりも一言モードの方が少し早く入力できると思います。
わいひら
キーマスター書き込みに気づいてませんでした。
近日中に使ってみますね。あと補正テーブルと音声コマンド拡張設定に検索機能を追加しました。
この機能は僕も前から欲しかった機能です。
この機能の実装はありがたいです。みち
ゲストわいひら様
Sokki Voiceの新しいバージョンは、ベクターからも公開されましたのでどちらからでもダウンロード出来ます。
わいひら
キーマスター先日インストールしてみました。
僕の環境では全く問題なく動作しています。
一言モードもかなり早くなったように感じます。今のところ特に変換の問題もないような…。
もうしばらく使ってみます。みち
ゲストわいひら様
Googleの方は、一言モードの場合は暫定の変換内容が1秒以上更新がない時にその時点の認識結果を得るようにしていてるので基本的には問題ないと思います。
稀に話してる最中に変換結果が返ってくるという事があるかもしれませんが、僕の場合は発音をミスる確率の高い気がします。
ちなみにGoogleの標準モードは1.5秒にしてます。
みち
ゲストわいひら様
Tool for Sokki Voice(音声で音声認識オン)の方はSokki Voiceとメモリを共有するやり方でトライしていて、これで行けそうなのでもう少しテストして大丈夫なら、6月10日頃に僕のウェブサイトにアップロードします。
プロセス間で通信するので、Sokki Voice(ver.4.3.2)も併せてアップロードします。
はじめはhttp通信でトライしましたが、セキュリティ的な観点からだと思いますが認証とか色々必要みたいなのでhttp通信はやめました。
わいひら
キーマスターありがとうございます。
承知いたしました。
Tool for Sokki Voiceがアップされたら試してみようと思います。みち
ゲストわいひら様
Tool for Sokki Voice Ver.2.0.0と
Tool for Sokki Voice Ver.2.0.0に対応したSokki Voice Ver.4.3.2を僕のウェブサイトにアップロードしました。ダウンロードに必要なパスワードはどちらも、
201382
になります。Tool for Sokki Voice Ver.2.0.0のダウンロード:
保護中: Tool for Sokki Voice Ver.2.0.0 | ソフト&アプリ工房 サークルロード (circle-road.com)Sokki Voice Ver.4.3.2のダウンロード:
保護中: Sokki Voice Ver.4.3.2 | ソフト&アプリ工房 サークルロード (circle-road.com)◯Sokki VoiceのVer.4.3.2では「標準モード」と「一言モード」を切り替える音声コマンドを追加しました。
あとGoogleの音声認識の変換結果についてですが、ここ最近は一言モードに関しては以前の変換結果(固有名詞などの語彙が多い方)に戻りましたね。
また標準モードについては最近の変換結果のままのようです。なんとなく新しい音声認識のテストをしてるっぽい感じですね。わいひら
キーマスター僕の以前動作しなかった環境で上記ソフトを試してみました。
Tool for Sokki VoiceでSokki Voiceを起動できるようになりました。◯Sokki VoiceのVer.4.3.2では「標準モード」と「一言モード」を切り替える音声コマンドを追加しました。
こちらも問題なく動作しました。
あとGoogleの音声認識の変換結果についてですが、ここ最近は一言モードに関しては以前の変換結果(固有名詞などの語彙が多い方)に戻りましたね。
詳しく検証はしていないですが僕の環境でも以前していた動作が変わったことはありました。
けどその動作も元に戻ったりして、何か色々しているのかもしれませんね。みち
ゲストわいひら様
Tool for Sokki Voiceがうまく機能して良かったです。
一応参考程度の情報ですが、
Tool for Sokki VoiceはVer.2.0.1.でSokki Voiceが起動していない時にCPUの負荷を抑えるためにマイクを待機中に移行するようにしました。
またVer.2.0.1.1でSokki Voiceの起動の有無と音声認識の状態この状態に対するチェックの処理を軽量化しました。ただこの軽量化については元々の処理が重いわけではないのであんまり影響はなかったみたいです。
Tool for Sokki Voice Ver.2.0.1.1のダウンロード:
保護中: Tool for Sokki Voice Ver.2.0.1.1 | ソフト&アプリ工房 サークルロード (circle-road.com)ダウンロードに必要なパスワード:
201382わいひら
キーマスターTool for Sokki Voiceを使って思った要望よろしいでしょうか。
Tool for Sokki Voiceは一度設定してしまえばほぼメインフォームを使うことはないので、できればタスクバー表示されずタスクトレイのみで表示されてコンパクトにできれば幸いです。
※可能であればSokki Voiceもタスクトレイ格納オンリーにできれば(出来る設定があれば)タスクバーの節約ができてありがたいです。みち
ゲストわいひら様
次のアップデートでTool for Sokki Voiceをタスクトレイのみにするオプションを追加しておきます。
あとSokki Voiceと連動して、
Sokki Voiceを起動したらTool for Sokki Voiceを起動したりSokki Voiceを終了したらTool for Sokki Voiceも終了する方向で検討してみます。アップデート時期は、今月僕がちょっといろいろ忙しいので来月になります。
まずはTool for Sokki Voiceをアップデートして、
その後Sokki Voiceの方についてもトライしてみて不都合がなければ、Sokki Voiceの方もタスクバーにアイコンを表示しないオプションを追加します。わいひら
キーマスターありがとうございます!
そういった仕様になるとタスクバーが2つ開くのでアプリを余分に開けるようになり捗ります。
今のままでも十分便利で全然急いではおりませんのでほんとありがたい限りです。みち
ゲストわいひら様
とりあえずTool for Sokki Voiceの方を通知領域(タスクトレイ)に格納する機能の追加はわりとサクッとできたので、
僕のウェブサイトにアップロードしました。Tool for Sokki Voice Ver.2.1.0のダウンロード:
保護中: Tool for Sokki Voice Ver.2.1.0| ソフト&アプリ工房 サークルロード (circle-road.com)ダウンロードに必要なパスワード:
201382Sokki Voiceの方は多分できると思うのですが、Sokki VoiceはあまりPCに詳しくない人も利用しているので、一番悩ましいのは知らないうちに間違って通知領域(タスクトレイ)にアイコンを格納してウィンドウを非表示にしてしまった時にどうやって元に戻していいのか分からなくなる人が出てくるような気がしてその辺がちょっと悩ましいです。
うっかり間違ってタスクトレイに格納してしまうことがないように考えてみます。
こっちのアップデートは間違いなく7月に入ると思います。わいひら
キーマスターTool for Sokki Voiceがタスクトレイに格納されることを確認しました。
加えてタスクトレイに格納された状態で終了し再起動すると、タスクトレイに格納された状態で起動することを確認しました。一番悩ましいのは知らないうちに間違って通知領域(タスクトレイ)にアイコンを格納してウィンドウを非表示にしてしまった時にどうやって元に戻していいのか分からなくなる人が出てくるような気がしてその辺がちょっと悩ましいです。
「詳細設定」に注意書きとともに設定を設けておけばさすがに大丈夫そうな気もしますけど。
パソコンに詳しくないレベルにもよりますよね。みち
ゲストわいひら様
「詳細設定」に注意書きとともに設定を設けておけばさすがに大丈夫そうな気もしますけど。
そんな感じにすると思います。
タスクトレイに格納するための操作が面倒くさいのもイマイチなので、メインウィンドウのボタンからタスクトレイに格納出来るようにして、そのボタンを有効にするための設定を詳細設定あたりに設ける感じにしようと思ってます。
みち
ゲストわいひら様
タスクトレイに格納する機能を追加したバージョンのSokki Voiceは来週頃アップロードできると思います。
1.タスクトレイのアイコンの右クリックのメニューから、補正テーブル、音声コマンド拡張設定、メインウィンドウの表示、アプリの終了を行えるようになります。
2.音声コマンドの削除コマンドで現在は最後に入力した文字数の回数スペースキーをエミュレートするようになっていますが、
遡って削除できるようにした新しい削除コマンドも使えるようになります(旧削除コマンドとは一応区別している)。3.あとこのバージョンではSokki Voiceを起動する時に自動でTool for Sokki Voiceも起動するオプションも追加しています。
■あとSokki Voiceとは関係ないのですが、
先日Cocoonをアップデートしてからだと思いますが、Google AnalyticsのGA4の測定IDの設定が消えており僕のウェブサイトのアクセス解析がされない状態になっていました。現在は再度測定IDを設定してアクセス解析が正常に行われるようになりました。
不具合かどうかはわかりませんが一応報告させていただきました。みち
ゲストわいひら様
前回の投稿に書いた機能を盛込んだバージョンのSokki Voiceがベクターから公開されました。
是非使ってみて下さい!
https://www.vector.co.jp/download/file/winnt/writing/fh761736.html
わいひら
キーマスターすいません。最近ブログを書いてないのでこっちのサイトを見てませんでした。
後で最新版を使用してみます。■あとSokki Voiceとは関係ないのですが、
先日Cocoonをアップデートしてからだと思いますが、Google AnalyticsのGA4の測定IDの設定が消えており僕のウェブサイトのアクセス解析がされない状態になっていました。現在は再度測定IDを設定してアクセス解析が正常に行われるようになりました。
不具合かどうかはわかりませんが一応報告させていただきました。これCocoonフォーラムには来てなかったようなので気づいてませんでした。
後で確認してみます。わいひら
キーマスターSokki Voiceのタスクトレイ格納、正常に動作しました。
タスクバーのボタンが1つ減ってタスクバーをより有効に使えるようになりました。
またTool for Sokki Voiceはスタートアップに登録していたのですが、Sokki Voiceと同時起動するようにも変更できました。
いつも更新ありがとうございます。みち
ゲストわいひら様
追加した機能が問題なく動いて良かったです。
テキストの削除コマンドも、新しいコマンドを使えるようになっているので、まだ使ってなければ試してみて下さい。
直前の内容の削除だけでなく、遡って削除出来ます。
わいひら
キーマスターすいません。
そこら辺がどう使って良いかわからず使ってませんでした。
どこかにマニュアルってあります?みち
ゲストわいひら様
今回追加したコマンドは、音声コマンド拡張設定の「リストから選択」のタブの左下のコンボボックスから選択出来ます。
あと、わいひらさんにとって有用かは、ちょっとわかりませんが、マウスポインターをピクセルを指定して移動するコマンドもあります。ちょっとだけ移動したい時とかに使ったりするみたいです(これもリストから選択のタブにあります)。
あとオンラインマニュアルやQ&Aには、
Sokki Voiceメイン画面右上のオンラインサポートのリンクからたどり着けるようになってます。
ただ、オンラインマニュアルは音声コマンドを一つ一つ取り上げて説明してるわけではないです。
Sokki Voice本体のキャプションでどんなコマンドか説明するようにしてます。
マニュアルもあんまり細かく書きすぎると逆に読まれなくなるし中々微妙なところですよね。
わいひら
キーマスターありがとうございます。
後で試してみますね。
わいひら
キーマスター遅くなってすいません。
入力した文字数の削除機能を使ってみたら問題なく動作しました。
リストの一番上にあったんですね。
前回試した時、新機能なので下の方にあるのだとそこばっかり探していました。みち
ゲストわいひら様
問題なく使えたと言う事で良かったです。
1番目立つところに持ってったんですが、それがあだになった感じでしたね。
-
この返信は2年、 1ヶ月前に
- 投稿者投稿