日本版Google Homeのレビュー。過去に自作した音声認識ソフト(※組み込み)と比較

2017年10月6日、日本でもGoogle Homeが発売されました。

Google Homeといえば、声で様々なことに答えてくれるAIアシスタント型スマートスピーカーです。

声で操作するということで、音声認識デバイスと言っていいでしょう。

音声認識といえば、過去に僕も声で家電を操作する音声認識ソフトを作っていたことがあります。

僕の場合は単に、Windows組み込みの音声認識エンジンSAPIのAPIを利用しただけでエンジン自体はノータッチ。しかもかなり前。

加えてこのブログも、音声入力で書いています。

なので僕自身「音声で操作できる」というものに、ものすごく興味があり、「これは買うしかないでしょ!」ということで、すぐさま購入しました。

その後、利用すること約1ヶ月、いろいろと思った感想を書きたいと思います。

スポンサーリンク
レクタングル(大)広告

Google Homeとは

あらゆる生活シーンをサポート。Google Homeのご紹介

Google Homeとは、Google アシスタントがハンズフリーで様々なお手伝いをしてくれるAI型スマートスピーカーです。

Google Home自体、機能は多岐にわたるので、ちょっとここですべては書ききれません。

なので大まかではありますが、「話しかけるとどんなことが主に出来るのか?」を箇条書きするとこんな感じ。

  • 音楽を流してくれる
  • IoT対応機器があれば電気やエアコンを操作できる
  • Chromecastと組み合わせれば映像をテレビに映し出せる
  • radikoを利用してラジオが聴ける
  • 料理タイマーなどとして利用できる
  • 起床時間等のアラームをセットできる
  • 時間を教えてくれる
  • 天気や気温を教えてくれる
  • 株価情報を教えてくれる
  • 自分のスケジュールを聞ける(※要Googleカレンダー情報など)
  • 分からない言葉をネットで調べて教えてくれる
  • 地域情報を調べる(近くの駅とか、道のりとか)
  • 電話番号を調べてくれる
  • 計算してくれる(例:20×56は?)
  • 最新ニュースなどを教えてくれる
  • 動物の鳴き声を調べられる
  • ピカチュウと話が出来る

できることは他にも多々あるのですが、主に利用されてそうなものを挙げてみました。

2017年11月時点での、対応サービスはこちら。

実際に届いたGoogle Home

で、購入して届いたGoogle Homeがこちら。

Google Homeの箱

僕の場合は、Chromecastと連動させて使いたかったので、「Google Home & Chromecastセット」を購入しました。

Google HomeとChromecastセット

箱の蓋を開けると、こんな感じでパッカーンと出てきました。

Google Homeの箱の蓋を開けた状態

箱の中に入っていたものを全て取り出してみると、こんな感じ。

Google Homeの同梱物

  • Google Home本体
  • ACアダプター
  • 利用手順書
  • 台座(※これは箱の中にキッチリと納めるため用で実際の利用では不要そう)

Google Home本体は、こんな感じの「単なる円柱状の筒」といった外観です。

Google Home本体

大きさは、縦横9.6cm、高さが14.3cm。重さは477gとそれなりに大きいです。

僕の中では、お歳暮などで貰う海苔の缶々ぐらいのサイズ感。

【高級 ギフト】焼き海苔 ゴールド缶 箱入り 8切208枚入り

こんな円柱状のものに、ACアダプターを取り付けて、家庭用コンセントに差し込めば、機器のセットアップは終了です。

モバイル端末でのセットアップ

あとは、スマホ等のアプリを用いて設定を行います。

Google Home アプリを使用すれば、Google Home デバイスや Chromecast デバイスのほか、ライト、カメラ、サーモスタットなど、数千種類に及ぶスマートホーム製品の設定、管理、操作を、すべて 1 つのアプリから行えます。 家のデバイスをまとめて管理。 ライト、カメラ、テレビなどの対応するデバイ...
‎Google Home アプリを使用して、Google Home デバイスや Chromecast デバイスをはじめ、インターネットに接続された照明、カメラ、サーモスタットなどのさまざまなホームデバイスをすべて 1 つのアプリで管理したり操作したりできます。 家のデバイスをまとめて管理。 照明やカメラ、テレビなど、...

ただ、僕は購入した時点でAndroidもしくは、iOS端末を持っていませんでした。

だけど「Androidエミュレーターを利用すれば設定ぐらいはパソコンからでもできるだろう」と安直に考えていました。

けれど実際、AndroidエミュレーターのNoxPlayerBlueStacksAndyGenymotionでGoogle Homeアプリをインストールしてパソコンから設定を試してみたのですが、全てうまくいきませんでした。

どうやら、Androidエミュレーターからでは設定ができないようです。その他にも「パソコンから何とかして設定できないものか?」と様々調べてみたのですが、どうやらモバイル端末からしか初期設定できない模様。

モバイル端末といえば、Kindle Fireタブレットを持っているのを思い出して試してみました。しかし、これも一般的な方法ではGoogle Homeアプリは利用できませんでした。

結局、しょうがないので、妹にiPodを借りてGoogle Home設定を行いました。

主なGoogle Home設定の流れは以下。

  1. Googleアカウントの登録
  2. 利用に同意する
  3. デバイスの検出
  4. 利用する部屋の選択(自室とかベッドルームとか)
  5. Wi-Fiの設定(Wi-Fiの選択とパスワード入力)
  6. Googleアシスタントの設定
  7. 住所の入力(Googleアカウントに登録されているのが表示)
  8. 利用音楽サービスの登録(Google Play Music、Spotifyとか)
  9. 利用Chromecastの登録(使用している場合)
  10. 利用動画サービスの登録(Netflixとか)

上記のように、羅列すると難しいように感じるかもしれません。

けれど、アプリ内でしっかりと案内が出るので、「案内のまま操作していくと設定が終わっている」といった感じです。Wi-Fiとかの意味さえ分かっていれば難しくはありません。

設定が終わると、こんな画面。

ほんと、案内通りにやれば、特に難しいことはありません。

しばらく使用してみた感想

で1ヶ月以上、自分なりに使い込んでみました。

その結果、「Google Homeの音声認識機能は素晴らしい」と思う部分が多々ありました。

僕が作っていた音声操作ソフトは、Windows組み込みの音声認識エンジンを利用したものでした。やはりそれとは、比較できないほど音声認識能力は高いです。

僕が作っていた時期も、2013年と古いので「そりゃ進歩もするでしょ」という感じではありますが、それを踏まえたとしても、やっぱりすごいなと。

Google Home音声認識のココがすごい

以下では、Google Homeの音声認識技術について「スゴイ!」と思ったことについて書きたいと思います。

比較対象が比較対象なもので、僕自身必要以上に「スゴイ!」と思ってしまっている部分はあるかもしれません。

誤認識がほとんどない

Google Homeの音声認識を使ってみて、まず驚いたのが「誤認識が全くといっていいほどない」ということです。

僕が以前利用していたWindows音声認識エンジン(SAPI5.1:古い)では、誤認識防止になるべく長めの音声コマンドを割り振っておいたとしても、テレビの音などで1日平均1回ぐらいは誤認識し誤動作していました。

けれど、Google Homeの場合は、全く誤認識しません。そりゃ、「呼びかけコマンド」の「OK、Google」とか「ねえ、Google」と間違って声に出せば(テレビから音声が流れたりすれば)動作はします。そういう仕様なのだから。

けれど、日常生活でそんなことを言うのは、ほぼほぼ稀なので、誤動作が無いと言っていいレベルに達していると思います。

これは、「Google Homeが利用しているマイクが素晴らしい」というのと、「僕の自作したプログラムがショボイ」なんて要因も十分に考えられます。

ただそれでも、「必要な時にしか動作しない」というのは感動しました。

周りがうるさくてもしっかりと聞き取ってくれる

僕が以前自作した音声認識ソフトは、ちゃんと音声コマンドさえ言えば、静かな環境だと95%ぐらいは認識してくれました。

けれど、テレビを点けたり、エアコンを入れたり、扇風機をまわしたりして使用環境内に雑音が入りこむと、認識率は60~30%ぐらいまで下がっていたと思います。

けれど、Google Homeの場合は、音声コマンドさえしっかり言えば、静かなところだと認識率はほぼ100%です(※コマンドを理解できないエラーではなくて、あくまで認識率)。

テレビを点けたり、エアコンを点けたりして部屋が多少うるさくても、ほぼほぼ100%認識してくれます。この技術は本当にすごいと思う。マジで、どうやっているんだろう。

また、Google Homeの場合は、多少音声コマンドを噛んだとしても意味を推測して答えてくれるところもよくできていると思います。

声を張らなくても聞き取ってくれる

僕がGoogle Homeを使うシチュエーションとして「明け方部屋真っ黒で目が覚めた際、まどろんだままの状態で時間が知りたい」なんてことがよくあります。

そんな時に、自作の音声認識ソフトだと90~100%の声を張って「今何時?(ハキハキとイイ声)」と聞かないと認識されませんでした。朝っぱらからイイ声を作って発声をしていると、目が覚めてしまって2度寝に悪影響をおよぼします。

けれど、Google Homeの場合、眠いテンションを引きずったままの「おーけーー…、ぐーぐるぅー…、いまんぁんじぃーー。。ZZZ..zzz..」みたいな30%のテンションで質問しても、ちゃんと時刻を答えてくれます。声のハリの感では、30%でも十分に聞き取ってくれます。

これだと、覚醒具合も少なくて済むので、無事に2度寝に突入できます。

遠くからでも声を聞き取ってくれる

あと、僕の部屋は13畳くらいの大きさがあるのですが、部屋の対面にあるGoogle Homeに話し掛けても、ちゃんと答えてくれます。

Google Homeと部屋の間取り

多少の距離なら、全く問題なく答えてくれます。

返答の最中でも次の指示を聞いてくれる

あと、Google Homeに何か質問をして返答している最中でも、「OK、Google」と呼びかけると、回答を途中で停止して、指示を待ってくれるのも地味に便利です。

「自分に必要のない答えだったら、すぐ次の音声コマンドを発したい」なんてシチュエーションも結構あるので、待たなくて良いのはいいですね。

また、途中で「答えを聞く必要がないな」と思ったときでも、「OK、Google、やめて」というと途中で終わってくれるのは、無駄なものを聞く必要がなくストレスを軽減できます。

実際のところGoogle Homeは便利なのか

音声認識技術は素晴らしいものがあるのですが、「実際のところ役に立つの?」と聞かれれば、「人による」としか言えないです。

正直、今のところは「大多数の人にはほぼほぼ役に立たないかも」といった印象です。

少なくとも、「Google Homeってよくわからないけどなんだか使ってみたい」なんて人が買ってしまうと、1週間後には「コンセントに刺さった円柱状のオブジェ」になる可能性は高いかもしれません。

Google Homeを利用すると便利な層

Google Home(声で便利に)

では、「どんな人だとGoogle Homeのあると便利なのか?」というと、以下のような人かと思います。

  • Google Play Musicや、Spotifyに加入しているのでスマホではなく声で手軽にBGMをかけたい
  • よくラジオを聴くので音声で手軽に聞けるようにしたい(radiko
  • IoT対応の家電を使っているので声で家電の操作をしたい(スマートホーム化)
  • 料理中で手に油がついているので物を触らないでタイマーをかけたい
  • 次の日の起床アラームを声で手軽にセットしたい
  • 朝や夜暗い部屋の中、低いテンションで時刻を聞きたい
  • 朝や夜暗い部屋の中、低いテンションで今日の天気を聞きたい
  • 日本株の株価やPER(株価収益率)をネットを調べずに聞きたい

僕が「実践的に使えそう」と思ったのはこんな感じでしょうか。

Chromecastを、Google Homeからも操作することは可能ですが、あまり実践的な利用はできそうになかったので、含めていません。ただ、「テレビを消して」と言ったらテレビを消してくれるのは、地味に便利だったくらい。

使ってみて便利だった音声コマンド

Googleの音声コマンド例

Google Homeは、本当に様々な音声コマンドに対応しています。

けれど、「その全てが役立つコマンドか?」と言われれば、そうではないわけで。

以下では、僕が毎日Google Homeを使用する中で、個人的に便利だったコマンドを紹介したいと思います。

OK Google、今何時?

「時刻は○○時〇〇分です。」と答えてくれます。

これは、夜中に目が覚めた時に電気を点けなくても時刻が分かるので助かります。

OK Google今何時?

下手に電気を点けてしまって目が覚めてしまっても困るので。

これだったら目をつぶって、半分寝たテンションの低い状態でも利用可能です。

OK Google 今日(明日)の天気は

「今日は、予想最高気温〇〇度、最低気温〇〇度で、断続的に雨が降るでしょう。(地域名)は〇〇度、曇りです」のように答えてくれます。

その日や翌日の、最高気温・最低気温が聞けるのはいいですね。

これも、冬の明け方寒い早朝などに聞くと便利。

OK Google 今日の天気は?

布団の中で、その日の衣類の計画を立てられます。

OK Google (ラジオ番組名)つけて

「radikoから(ラジオ番組名)をストリーミングします」と返答が来てラジオが入ります。

ただしラジオ自体は、radikoからネット配信されているものしか聴けません。

PC・スマートフォンでラジオが聴けるradiko 一人の時間をもっと快適に楽しく!今日からあなたもradikoで音のある生活、はじめよう!

「OK Google 止めて」というと止まります。

部屋で1人物寂しいときに、BGM代わりにするのも良いかと。

OK Google 日経平均は?

「本日○○時、日本標準時時点の日経平均は、〇〇%上昇し、〇〇〇〇円となっています」と答えてくれます。

日経平均イメージ

これは単に、今日の株価全体が平均して上がっているのか下がっているのか知るだけならば、ネットで調べなくても良いので助かります。

OK Google 株式会社(会社名)の株価は?

例えば、トヨタの株価を聞いたとすると、「本日〇〇時日本標準時の東京証券取引所でトヨタ自動車の株は7108円、昨日から0.81%下降しています」と答えてくれます。

トヨタ自動車の株価

何かしらのニュースを見て、「これは…、自分の保有している株に影響がないか?」と確認するのに便利。

トヨタのような有名な会社は音声コマンドに「株式会社」を付加する必要ないけど、マイナーな会社は、「株式会社」を付けないと認識されません。

OK Google 株式会社(会社名)の株価収益率(PER)は?

これもトヨタで聞いてみると、「本日○○時(日本標準時)時点での株価収益率は10.79倍です」と答えてくれます。

トヨタの株価収益率

PER(株価収益率)は、企業の割安性を示す指標の1つです。テレビや雑誌などを見ていて「おっ、この企業企業の株を買ってみようかな?でも、今どれくらい割安なんだろう?」と大まかに調べるのに便利です。

もちろん、株価収益率だけで投資を判断するわけではありません。が、調べた株価収益率が100倍とかになっていると、明らかに割高だと分かります(※もちろんそれ以上に企業の成長性があれば別ですが)。その場合は、とりあえず投資対象から外して、わざわざネットで割安性を調べる手間が省けます。

その他にも、「株価収益率以外にもGoogle Homeで聞ける株式指標はないのか?」と、いろいろ聞いてみました。

けれど、「PBR(株価純資産倍率)」、「ROE(株主資本利益率))」、「ROA(総資産利益率)」、「配当利回り」、「自己資本比率」などは「すいませんよく分かりません」としか答えてくれませんでした。「時価総額」とかなら答えてくれます。

トヨタのような有名な会社は音声コマンドに「株式会社」を付加する必要ないけど、マイナーな会社は、「株式会社」を付けないと認識されません。
あまりにもマイナーな会社(特徴のない企業名も)だと「わからない」と言われる場合もあります。

OK Google 〇〇時〇〇分にアラームかけて

「〇〇時〇〇分にアラームをセットしました」と答えて、設定した時間にアラームを鳴らしてくれます。

目覚まし時計

音声コマンドさえ覚えてしまえば、Google Homeの方がアラーム設定が楽のような気がします。特にデジタル時計の場合は、設定が面倒くさいので助かります。

僕の場合、見逃したくないテレビ番組のちょっと前にアラームをかけて「見逃し防止」として利用したりしています。

「OK Google アラーム止めて」というと、「はい、オフにしました」といって解除されます。

OK Google タイマー〇〇分

すると、「はい、〇〇分ですね。スタート」といってタイマーカウントが始まります。

キッチンタイマー

解除したい場合は「OK Google タイマー止めて」というと「はい、オフにします」と言って止めてくれます。

これは料理中、手がベタベタしていて、キッチンタイマーを指で押したくないときなどには重宝しそうです。

あと、カップラーメンを作った後の「OK Google タイマー3分」は鉄板の利用方法でしょう。

OK Google (作品名)の監督は?主演は?声優は?

映画やアニメの監督名などを調べることが可能です。その他にも、アーティストの楽曲を調べたり、タイトルからアーティストを調べたりも可能。

これは、完全に話のタネ用と言った感じ。

ある程度名前の知れた作品でないと答えられない可能性があります。

監督

例えば、「ララランドの監督は?」と質問すると「ララランドの監督はデイミアン・チャゼルです」と答えてくれます。

「クレヨンしんちゃん オトナ帝国の監督は?」と質問すると「クレヨンしんちゃん 嵐を呼ぶモーレツ!オトナ帝国の逆襲の監督は原恵一です」と答えてくれます。

主演

「ショーシャンクの空にの主演は?」と質問すると「モーガン・フリーマン、ティム・ロビンスなど」と答えてくれます。

「映画デビルマンの主演は?」と質問すると「伊﨑 央登、伊﨑 右典など」と答えてくれます。

「ドラゴンボール エボリューションの主演は?」と質問すると「ジャスティン・チャットウィン、エミー・ロッサムなど」と答えてくれます。

声優

「毛利小五郎の声優は?」と質問すると「神谷明、小山力也」と双方答えてくれます。

それならば、「ドラえもんの声優は?」と質問すると「大山のぶ代、水田(すいでん)わさび」と答えてくれます。たまに、漢字を読み間違えるのはご愛嬌。

作品名と組み合わせて質問すると詳しく聞くことも可能です。「攻殻機動隊の荒巻大輔の声優は?」聞くと「阪脩、塾一久、ウィリアム・フレデリック・ナイト」と答えてくれます。

ただ、あまり一般的に知られていない作品だと、「分かりません」と言われてしまいます。

OK Google ピカチュウと話したい

ピカチュウが出てきて「ピカチューー、ピッカピッカー」と話をしてくれます。

11 月 8 日より、Google Home や Google Home Mini で、ピカチュウとお話できるようになりました。 お手元の Google Home に、「ピカチュウと話したい」と声をかけてみて下さい。 可愛らしいピカチュウが、元気いっぱいお返事してく...

これは、単に幼子が喜ぶ(※最初だけ)。

Google Homeの難点

一応、使ってみて感じたGoogle Homeの難点も書いておきます。

大きく思ったのが、以下の2点でしょうか。

  1. 音声コマンド履歴はGoogleに残る
  2. 常に部屋の中にマイクがあって、やろうと思えば音を拾える状態

音声履歴がクラウドに残る

Google Homeを用いて質問した履歴は、マイアクティビティーに残ります。

しかも、自分の発した音声付きで。

Googleのマイアクティビティーに残る音声履歴

もちろん、本人がアカウント情報を入力しないと見えない場所に置いてはあります。けれど、「履歴は残る」ということを常に頭の片隅に置いといて、あまり恥ずかしい質問は避けておいた方が無難かもしれません。

部屋の音はGoogle次第

あと、実際にGoogleが部屋の音を不正利用しているかは別として、盗聴的なことをやろうと思えば出来ないことはないと思います。

もし、悪意のある第三者にハッキングなんかされてしまうと、「部屋内の音は筒抜けになる」と考えておいた方が良いかもしれません。

なので「いつも部屋の中に高性能マイクが稼働している状態が気持ち悪い」と感じる場合は、使用しないほうが無難かと思います。

あと、エラーが出たときは、確実に前後の音声データをサーバーに送っている感じの間は感じますね。ただこれが、解析されて今後の製品強化のために使われているとは思いますが。

その他

その他に、「Google Homeに質問の意図が伝わらない場合が多々ある」、というのもありますが、これは購入前から想定出来ていたことなので、そこまで不満には感じませんでした。

これ自体は、今後利用状態をGoogleが解析して、ブラッシュアップされていくとは思います。

まとめ

結局のところ僕が主に利用するのは、「夜中に時間を聞く」とか「外の気温を聞いて暖房の付け具合を探る」くらいでしょうか。

他にも利用しますが、そこまで使用頻度は高くないです。

とは言ってもまだAIスピーカーは、日本で出始めです。最初はこんなもんでしょう。というか、僕の中では想定以上に使える代物でした。

また、今後Google Home自体勝手にアップデートしていってくれるので、トライ&エラーを蓄積して更に使い勝手が改善されていくとは思います(※日本市場が今後もGoogleにとって魅力的な市場であれば)。

個人的には、これからがより楽しみなAIスピーカではあります。