kun432's blog

Alexaなどスマートスピーカーの話題中心に、Voiceflowの日本語情報を発信してます。たまにAWSやkubernetesなど。

〜スマートスピーカーやVoiceflowの記事は右メニューのカテゴリからどうぞ。〜

Amazon 新デバイスの個人的まとめ①

f:id:kun432:20210929083109p:plain

去年も今頃だったのかな、Amazonから新しいデバイスの発表がありました。詳しい内容は以下の記事をご覧いただくとして、超個人的な感想をまとめてみます。あくまでも個人的な感想なので、あしからず。

※結構ボリューム増えたので2回に分けます。

発表された製品のまとめはこちら(英語)

TechCrunchのまとめもわかりやすいですね(英語。多分日本語も後で出てくると思います。)

発表会の動画はこちら

目次

AZ2プロセッサ

f:id:kun432:20210929093320p:plain

第4世代Echo/Echo Show 10に搭載されているAZ1プロセッサ、そして今回発表されたEcho Show 15に搭載されているAZ2プロセッサにより、クラウド上に送信することなく、デバイス上で音声処理が可能になったそうです。

プライバシーというテーマで紹介されていましたが、個人的には、デバイス側での性能向上はいろんなところでメリットがあると思っていて、特にASRに関わる部分で今までできなかったことなどができるのではないかと期待しています。

たとえばユーザカスタムなウェイクワードとかね!カスタムアシスタントも少しづつ広げようとしているようだし、これはぜひやってほしいな。

スマートサーモスタット

f:id:kun432:20210929085353p:plain

$59という価格がどうかなー。

例えばSwitchBotなら、スマホ経由で使うだけならサーモスタットは$19、Alexaと連携したり他のデバイスと連携するならハブを$39で買えば似たような金額になるし、ハブは1台だけあればよいはず。Nestのサーモスタットに比べれば安いし、SwitchBotの場合はどうしてもAlexaのスマートホームデバイスというレイヤーが一枚間にあるので、SwitchBot側の設定が必要だったりすることも踏まえると、導入が多少かんたんにはなるとは思うけど。

そこそこの値段でかんたんに使えそうでAlexaとも連携できるというところがウリになるのかな。目新しい機能は特に見当たらないけど、サーモスタット自体そんなに買う人が多いとは思えないので、案外売れたりするのかなという気もする。

Echo Show 15

f:id:kun432:20210929091328p:plain

噂通りに出てきた15インチ壁掛けEcho Show。$249.99。

大画面化は歓迎なんだけど、いろいろな情報をたくさん表示できるんだったら、個人的にはAtmoph Window並(27インチ)に大きければなーという感じ。15インチだと少し離れると多分見えないと思うし、Atmophぐらいの大きさだとデジタルサイネージ的にも活用できそうな気がする。

縦横どちらでも使えたり、この前発表されたAlexa Widgetが早速活用されそうだし、付箋なんか特にいいと思う。リングドアベルの映像をピクチャー・イン・ピクチャーな感じで表示できるのも良く出来てる。なんとなくこれなら冷蔵庫に貼っつけたいなーと思ってたら、やっぱりキッチンのスマートテレビとして想定しているみたい。

なので、繰り返しになるけど、個人的にはとてもサイズが残念で、リビングのデジタルハブとして使うにはもっと大きいものが欲しかったな。まあそっちはFire TVで、ってことなのかもしれない。

Visual ID

f:id:kun432:20210929100109p:plain

デバイスについているカメラが顔を認識して、そのユーザにパーソナライズされたコンテンツを提供してくれるというもの。

パーソナライズはユーザの使い勝手を良くするには必須で、GoogleのNest Hub Maxでは最初から実装されていたものなので、やっと追いついたか、というところ。デバイス側プロセッサの性能向上もあってこのあたりの処理がデバイスだけでできるというところが、セキュリティとかプライバシーに慎重なAmazonには必要だったのかもしれない。

できればここから開発者にも何らかの形で利用できるようにしてほしいところ。

Preference Teaching

パーソナライズその2。ユーザのお気に入りなどを覚えていく機能。

どういうふうに覚えるのかなと思ったら、ユーザの発話した内容を元に覚えていくみたい。それなら意識せずに使えるからいいなーと思う反面、それでどれユーザの好みを把握できるのかなーとは思う。ただこれは時間が解決しそうなので、ちょっと期待。

全然別物ではあるけど、Alexa Entitiiesみたいに、カスタムスキルからそれを読み出せるといいなぁ(きっと権限の許可が必要になるとは思うけど)

Custom Sound Detection

f:id:kun432:20210929095554p:plain

パーソナライズその3、と言ってもいいかな。Alexaが音声ではなくて、音を聞き取ってそれをもとに通知したりする機能。

これ個人的にはとても大きいなぁと思ったのだけど、プレゼンテーションを見てみると、一般的なモデルを作るのは大変、家庭ごとの音データとして、言っているので、おそらく簡易な学習になるのだろうと思う。音声だけじゃなくてサウンドも学習して汎用的に使えると色々面白そうと思ったのだけどなー。

ただ、それを差し置いても、ガラスが割れる音、犬や赤ちゃんの鳴き声、いびき、などいろいろ活用の幅が広がりそうな気はする。個人的にはこれが一番興味深いと思った。

Amazon Kids+

子供向けコンテンツの拡充。

一応日本でも提供されてるみたいだけど、どれぐらい利用されているのかな???

Celebrity Personalities

Alexaの声に著名人の声が使えるやつね。サミュエル・L・ジャクソンに続いて、シャキール・オニールとメリッサ・マッカーシーが追加されている。

これどこまで使えるものなのか、全然わからないけど、日本でもやってみてほしいなぁ。

Hey Disney

f:id:kun432:20210929101418p:plain

ウェイクワードだけじゃなくて、いろいろできるみたいだし、そして専用デバイスまで。IPは強いね。

ファンにはたまらないと思うし、今後も似たような事例が増えると良いなー。そして、こういうキャラクターは日本には山ほどあるのでぜひ日本でもやってほしい。

Amazon Glow

f:id:kun432:20210929101932p:plain

コロナでよく使われるようになったらしいビデオ通話部分を切り出して、プロジェクション&センシング機能をつけたものらしい。$249.99。

オンラインでの集まりもZoomなどのビデオ通話ツールが広く活用されているし、Echoデバイスが持っていたビデオ通話なんかもきっと活用されているんだろうな(個人的には全く使っていないのでちょっとわからない)。同じ画面内でやるんじゃなくてプロジェクションを使ったのはとても面白いと思う。常に顔が見えているというのが結構重要な気がするね。

ちょっとサイズは気になる(結構大きい)けど、コンテンツ提供者もディズニーを含めて揃えてる感があるし、コンテンツ作成もSDKが用意されているようなので、ちょっと興味深い(ただしDeveloper Previewっぽい)。

今まで見た中では、発表だけ聞いたときと、プレゼン見たときの印象が最も違った(いい意味で)やつかな。


結構真面目にプレゼン見ながら書いてたけど、まだ半分・・・ということで以下あたりはパート2に続きます。

  • Halo View
  • Ring Always Home Cam
  • Virtual Security Guard
  • Ring Jobsite Security
  • New Blink stuff
  • Astro