kun432's blog

Alexaなどスマートスピーカーの話題中心に、Voiceflowの日本語情報を発信してます。たまにAWSやkubernetesなど。

〜スマートスピーカーやVoiceflowの記事は右メニューのカテゴリからどうぞ。〜

今年もやってきた!Alexa Live 2022の個人的見どころ

今年もそんな時期なんですね。

毎年恒例のAlexa Liveが、2022年07月20日(水) 09:00(日本時間2022年07月21日(木) 01:00)にオンラインで開催されます!

昨年のイベントで開発者向けの新機能は発表こそそれなりにあったものの実際にリリースにされたもの(特に日本向け)はそんなに多くない印象があります。 今年はもう少しリリースを期待したいところですね。少しアジェンダを見ながら、勝手に推測してみたいと思います。

※例によってDeepL翻訳です。

アジェンダ

9:00(日本時間01:00)

[キーノートセッション] アンビエントインテリジェンスの世界を構築する
AmazonのリーダーシップとAlexaビルダーやブランドコミュニティのメンバーから、ビジネスを成長させ、次世代のAlexa体験を創造するために使用できる最新の機能やツールを紹介します。

去年に引き続き「アンビエント」がテーマになっているようですね。

10:35(日本時間02:35)

[パネルセッション] Eve、Philips Hue、Silicon LabsとのMatterに関する対談


スマートホームのリーダーであるEve、Philips Hue、Silicon Labsが、顧客にとって重要な体験を構築するためにAlexaと提携する理由と、成功のための準備について話を聞きます。

Matterも今年ホットになりそうなテーマの一つですね。

標準的な規格の採用によりユーザーにとってはプラットフォームに依存しなくて済みますしハードウェアメーカーも複数プラットフォームに対応しやすいのも良いと思います。ただ、プラットフォーム側はどうやって差別化するのか、また個人の開発者にとって直接的なメリットがあるのか、はあまりわかってないので、しっかり聞きたいですね。

11:00(日本時間03:00)

[ブレイクアウトセッション] Alexaと一緒にアンビエントホームを構築する
今日と明日、お客様に喜ばれるスマートホーム体験を提供するための新機能をご紹介します。

スマートホームは以前から音声の訴求力が高いポイントですね。ただここはメーカーさん向けかなぁという気がします。ユーザーとして聞きたい感じですかね。

[ブレイクアウトセッション] スキルのエンゲージメントとリテンションを促進する
スキルのエンゲージメントを促進し、顧客にパーソナライズされた体験を提供するための新しい方法をお聞きください。

パーソナライズ的な機能は今も色々提供されていますが、なにか新しいものがあるのでしょうか?ちょっと期待。

[ブレイクアウトセッション] スマートウォッチでの Alexa
スマートウォッチでハンズフリーの音声アクセスを提供することで、Alexaがどのように顧客に役立っているかをご紹介します。

Alexa対応スマートウォッチはこの辺かな。Amazon公式はないはず。

ただFitBitはAlexaオンリーというわけではないですし、そもそもGoogleに買収されたはずです。あと、ハンズフリー?ウェイクワードに対応してるものはあったかな?もしかすると・・・

ひそかに期待してます!

11:30(日本時間03:30)

[ブレイクアウトセッション] AlexaスマートホームとMatterを間近で見る
Matterの開発者向けツールが、プロトコルを超えたビルドをどのように支援するかを学びます。フラストレーション・フリー・セットアップやその他の Matter 用 Alexa 機能のデモをご覧ください。

ここもMatterですね。メーカーさん向けな感じ。

[ブレイクアウトセッション] Alexa でビジネスを成長させる
Alexa スキルをどのように収益化できるかを学びます。

今のところ、日本で公式にリリースされているのは、スキル内課金、Amazon Pay連携、あとは有料スキルですかね(普通に開発者コンソールに出てくるのでリリースされたのかな?)。ただ、まだスキルで食べていくというのはまだまだ厳しいですし、去年発表されたAlexaショッピングとかAmazonアフィリエイトは開発者プレビューのままです・・・

新しい機能もほしいけど、正式にリリースしてほしいというのもありますね。

**[ブレイクアウトセッション] スマートテレビでAlexa
Alexa を使って、スマートテレビからお気に入りの映画を見たり、スマートホームを管理したりする方法をご紹介します。

ここは1ユーザとして見たい感じですね。Fire TV StickとかFire TV Cubeがあればいらないような気もしますが、ビルトインならでは、というところを知りたい。

12:00(日本時間04:00)

[ブレイクアウトセッション] Alexa Connect Kitでスマートデバイスを簡単に構築
ACK SDKを使用してコスト効率の高いコネクテッドデバイスを構築する新しい方法について、最新機能とその使用方法をご紹介します。

Alexa対応デバイス向けですね。

[ブレイクアウトセッション] 新しいツールで高品質なスキルを素早く作成
より魅力的なスキルをより早く、より少ない労力で構築するためのツールに潜入し、スキルの品質を向上させ、顧客エンゲージメントを促進する方法について学びます。

開発向けや解析向けにいろいろツールはありますが、なにか新しいものありますかね?

[ブレイクアウトセッション] セットトップボックスのAlexa-顧客のスマートホームの新しいハブ
Alexaがセットトップボックスをコンテンツ配信デバイスからスマートホームのハブに変える方法について学びます。

これもデバイスの話かな?

12:30(日本時間04:50)

[ブレイクアウトセッション] Alexaの在庫切れ通知とスマートな再注文
Alexaの低品質通知とスマート再注文プログラムの最新機能、改善、およびカテゴリの拡大について学びます。

Alexa対応プリンターのインク残量が減ったら、みたいなやつですね。デバイスの話ではあるけど、Skill Connectionsとかに関連した機能で面白いのがあれば聞きたい気はしてます。

[ブレイクアウトセッション] APLとAlexa Conversationsでよりリッチなスキルを構築する
マルチモーダルおよび会話型エクスペリエンスで魅力的なスキルを作成するための新しい方法を発見してください。

スキル開発者向けにはこれですかね。Alexa Conversationについては以前少し触ってみて、メリットはたしかにあるのだけど、それ以上に工数掛かりそうな気はしてます。そのへんの改善とかベストプラクティスとかあるなら聞きたい。あとAPLは個人的にあまり力を入れてないのだけど、そろそろ無視できない気はしてます。

[ブレイクアウトセッション]マルチアシスタントのショーケース
複数同時のウェイクワード体験がどのように顧客に選択肢と柔軟性を提供するか、またその開発をどのように始めるかを学びます。

「複数同時のウェイクワード体験」ってなんでしょうか?セレブリティのやつ?なんか違う気もする。これ、めちゃめちゃ気になる・・・・

まとめ

去年に引き続き、イベント当日はスキル開発関連を中心に見ようかと思ってます。個人的にブレイクスルーがほしいと思っているのは、Alexa Conversationと収益化のところ。ここで面白そうな新機能がリリースされてほしいですね。あとデバイス開発系、結構豊富な印象ですね。個人開発者としては少しハードルが高い印象がありますが、こちらはオンデマンドで公開されたら見ようと思います。

当日はTwitterでタイムリーにつぶやく予定です。また、イベントで発表されそうな機能を予想するのも楽しいですね。要望含めてつぶやいてみました!

年に一度のお祭なので、皆さんそれぞれにイベントを楽しみましょう!

音声・言語系プラットフォームのビルトインなスロット/エンティティタイプを比較してみた

対話モデルを作成する場合、インテントにせよ、スロット/エンティティにせよ、自前で値を用意するのはけっこう大変です。可能な限り、プラットフォーム側で予め定義されたものがあるほうが便利ですよね。

ということで、各音声・言語系サービスのビルトインなスロットやエンティティタイプについて、日本語でサポートされている状況をリストアップ・比較表にしてみました。

・日本語のみです。
・筆者はAmazon Alexaをメインで触っており、それ以外の他社については詳細なところまで把握できていません。
・ざっとドキュメントを見ながら比較しています。詳細は必ず各社のリファレンスを参照してください。
・あくまでも個人の所感です。不備等あればご指摘いただけると助かります。

目次

対象

Amazon Alexa

Amazon Lex

Google Dialogflow CX

Google Dialogflow ES

Google Actions Builder

Microsoft LUIS

比較リスト

まとめたリストはこちら docs.google.com

ざっくり見た感じのあくまでも「個人的」な印象。

Alexa

  • 数だけでいうと、Alexaが一番多いです。
  • 使用頻度が高い「数」「日付・時間」「名前」といった基本的なスロットタイプは抑えつつ、一般のコンシュマー向けが想定されているためか、特定の分野に特化したリストタイプのスロットが多いのが特徴です。例えば音楽/映画/本などのエンタメ系。このあたりはAmazonのショッピングなどとも強く関連しそうですね。
  • Alexaのビルトインスロットタイプの多さは地味に助かるんですよね、拡張もできるし。

Amazon Lex

  • 「数」「日付・時間」「名前」といった基本的なスロットタイプはまあ抑えてある。けどAlexaよりは少なめな印象。
  • Lexは英語ロケールだとAlexaのスロットタイプがそのまま使えるみたいなんだけど、日本語はこれに対応してないんですね・・・ベースの技術は同じだと思ってるし、英語ではできているわけなので、ここはちょっともったいない。
  • Alexaでは音声が全面にあると思っているけど、Lexの場合は音声だけではないので、URLとかメールアドレスのような「音声で認識が難しい」ものもサポートされている。AlphaNumericとかAlexaにも欲しい!
  • 真面目にきちんと見たことなかったのだけど、ここまで少ないとは思わなかった。SearchQuery使えないかー、とは正直思ってしまった。

Google Dialogflow CX/ES

  • 基本的なところはそつなく抑えてあって、あんまり困ることはなさそうって感じ。ESもCXもそれほど違わない印象です。
  • 自由な発話も@sys.anyとかでいけるし、URLやメアドのような「音声で認識が難しい」ものもサポートされているので、スマホやブラウザでのチャットボット利用なんかもしやすそう。
  • Alexaのようないろいろなリストタイプのものは少ないけど、そもそも実際に必要になるケースはそれほどなかったりもすると思うし、必要になってから作ればいいと思うし。

Google Actions Builder

  • 元々Dialogflowだったものから、こちらに移行されてきて、正直足りなさすぎて辛い・・・これは日本語なので、ということではなく、全ロケールでこんな感じ。
  • なので、こういうオープンソースで増やしていこうぜ、みたいな取り組みがあったりする。
  • この辺も意識せずにすべて機械学習でなんとかするぜ!みたいな考え方なのかなぁ・・・と思ったりもするけど、現時点では正直つらいと感じている。

Microsoft LUIS

  • こちらもかなり少なくて辛い。
  • 英語/中国語だと基本的なところはある程度サポートはされている様子(とはいいつつも他に比べると弱い印象は否めない)なので、これはもうホント日本語のサポートが弱すぎる。
  • やはり日本市場の優先度が低いってことなのかなー・・・

まとめ

各社いろいろ違いがありますね。実際に使う場合は、要件や各プラットフォームへの習熟度などに応じて選択することになりますが、やはり英語に比べると、日本語のサポートはどうしても見劣りしちゃいます。このあたりは各プラットフォームに頑張ってほしいし、開発者としてももっとプッシュしていく必要があるかなと思います。

AlexaやGoogle Actions Builderなどのプラットフォームに限定されているものはそれに従うことになるかと思いますが、Dialogflow ES/CXならば基本的なところはきちんと抑えてありつつ、最も汎用的に使えそう、という印象を持ちました。

Dialogflow最近あまり触っていなかったので、少しいろいろ触ってみようかなと思っています。

気が向いたらビルトインインテントも調べよっかな。

Voiceflowではじめる音声アプリ/チャットボット開発〜2022年版〜

2年ほど前に以下のイベントで登壇させていただき、Voiceflowについてご紹介しました。

あれから時間も経ってだいぶ状況も変わっているので、2022年現時点での内容に更新しました。

Googleスライドで公開しています。一部GIFアニ使ってるので動作イメージが多少分かる部分もあります。

PDFでサラッと見たい場合はこちら。GIFアニは動かないです。 speakerdeck.com

一部画面イメージなどの更新が追いついていない箇所もありますが、

  • プロトタイプの新機能
  • カスタムアシスタント/Dialog Management API

等、新しい機能についての説明を追加しています。

よろしければご覧ください。