kun432's blog

Alexaなどスマートスピーカーの話題中心に、Voiceflowの日本語情報を発信してます。たまにAWSやkubernetesなど。

〜スマートスピーカーやVoiceflowの記事は右メニューのカテゴリからどうぞ。〜

#VUIchallenge #001 - Welcome Message

f:id:kun432:20210711001052p:plain

#VUIchallenge というのを知っていますか?

Amazon Alexa AutoのVUI&UXデザイナーであるJesús Martínさんによる企画で、毎日1問、VUIに関するお題が与えられて、それに対するデザインやソリューションを考えて、みんなでシェアしよう!という取り組みです。ちょっとおもしろそうなので、参加してみました。

ということで、第1回は「Welcome Message」。

お題

The challenge

Design a Welcome message for a service called TVguide for a Google Action or an Alexa Skill. The service provides information about what's is set on TV and allows customers to ask for the information they need.

Jesús' Tips

The welcome message is the first prompt your customers will receive from your interaction. Is the entrance door for your experience and will need to help customers understand what's your >experience all about while keeping them motivated to carry on.
Most welcome messages have 3 parts:

  • Greetings.
  • Scope explanation.
  • Call to action.

DeepLによる日本語訳

課題

Google ActionやAlexa Skill用のTVguideというサービスのWelcomeメッセージをデザインしてください。このサービスでは、テレビで放映されている番組の情報を提供し、お客様が必要な情報を求めることができます。

Jesúsのヒント

ウェルカムメッセージは、お客様があなたのインタラクションから受け取る最初のプロンプトです。あなたの体験の入り口となるもので、あなたの体験がどんなものかをお客様に理解してもらい、先に進みたいというモチベーションを維持する必要があります。
多くのウェルカムメッセージは3つの部分から成り立っています。

  • 挨拶。
  • 範囲の説明。
  • 行動への呼びかけ。

デザイン

Alexaであればスキル、Googleであればアクション(以降は「スキル」で統一します)が起動した一番最初のメッセージですね。ポイントは3つ。

  • スキルのあいさつ
  • スキルでできること
  • 呼びかけの例(ユーザはどういうふうに問いかければよいか?)

かんたんなようで難しいですね。とりあえず以下の2パターンで考えてみたいと思います。

  • 初めて起動するとき
  • 2回め以降で使い慣れたとき

初めて起動するとき

初めて起動するときのポイントは以下です。

  • ユーザは、スキルで何ができるのかをあまりわかっていない
  • ユーザは、スキルに対して、どう発話すればいいのかあまりわかっていない

つまり、スキルについて、そしてスキルの使い方についてある程度の説明が必要だということですね。したがって、以下のような感じになると思います。(スキルの機能については例なのであまり深く考えないことにします)

はじめまして、TVガイドスキルをご利用いただきありがとうございます。※スキルのあいさつ
このスキルでは、今放送されているテレビ番組名とその情報をお伝えします。※スキルでできること
例えば「今やっている番組をおしえて」とか「今◯チャンネルでやっている番組をおしえて」と言ってみてください。※呼びかけ例

スキルのあいさつは、まずスキル名を伝えるのは重要かなと思います。これがユーザにとっては今起動しているスキルを識別する唯一の情報だと思うので。その意味だと、呼び出し名とスキル名はなるべく一致しているほうがいいでしょうね。ただ、だいたいどのスキルもだいたい似通った感じになってしまっているので、このへんで工夫するのはなかなか難しいです。これについては後述します。

スキルでできることは、シンプルかつ簡潔に「何ができるか?」を伝えることですね。長すぎると聞いてられないし、短すぎてもわかりません。

それを補完するのが、

  • 呼びかけの例
  • ヘルプ

になるでしょう。

呼びかけの例は、いくつかのサンプルを提示することでユーザは何ができるか?どう使えばいいか?のイメージを持てますし、想定する発話にユーザを誘導することで「ごめんなさい、よくわかりません」を回避することにつながると思います(もちろんサンプル発話のバリエーションは大いに越したことはないです)。

ただし、呼びかけ例もあまり多く挙げると長くなりすぎてしまうので、それは「ヘルプ」におまかせするのがよいと思います。例えば、上記の最後に「それ以外の使い方についてはヘルプと言ってみてください」とつけてもいいかもしれませんね。個人的にはいちいちヘルプを呼び出すのも長くなりすぎて面倒なので、初回はチュートリアル的な雰囲気が伝わるようなフローになればいいのではないかと思います。例えばこういう感じ。

はじめまして、TVガイドスキルをご利用いただきありがとうございます。
このスキルでは、今放送されているテレビ番組名とその情報をお伝えします。
例えば「今やっている番組をおしえて」とか「今◯チャンネルでやっている番組をおしえて」と言ってみてください。

今やっている番組を教えて

午後9時現在、放送中の番組は、2チャンネルで「ニュース9時」、4チャンネルで「クイズ◯◯◯」、・・・です。それぞれの番組を詳しく知りたい場合は、例えば「4チャンネルについて詳しく教えて」と言ってみてください。

4チャンネルについて詳しく教えて

午後9時現在、4チャンネルで放送中の番組は「クイズ◯◯◯」です。出演者は✕✕✕、△△△、ゲストは▲▲▲です。

このような感じで、このスキルでは放送中の番組についてお伝えすることができます。次回以降は「アレクサ、TVガイドで4チャンネル」といってスキルを起動すればスピーディにお答えします。また、他にもできることがいろいろありますので、その場合は「ヘルプ」と言ってみてください。

現実はそんなにかんたんではないんですがまあサンプルなのでw。

スキルはそもそも起動してもらってナンボ、かつ、長すぎるとめんどくさくなって離脱、短すぎるとよくわからなくて離脱、というとても難しいものなので、最初はなるべくシンプルに使い方を体験してもらって、2回目以降によりスピーディに目的を達成できるやり方をお伝えしたり、もっと詳しい説明のためのヘルプを案内するという感じで、ユーザのスキルの使い方への理解を徐々に深めてもらうというのが良いのではないかなと思います。

2回め以降で使い慣れたとき

初回に対して2回目以降のポイントは、ユーザはすでにスキルの使い方をある程度理解している、ということです。この場合は、

  • 無駄なく目的をスピーディーに達成できる事が重要
  • ワンパターンなやり取りを回避するための工夫も必要

が重要になると思います。

音声インタフェースは、やりとりの間の集中力を結構要求します。初回ですら長いとめんどくさくなるのが、2回目以降も同じことを長々と繰り返し聞くと使う気がなくなります。すくなくとも初回よりはユーザは使い方を少し理解している状態ですので、2回目以降はさらに簡潔にすべきですね。例えば、

  • スキルの使い方の説明はしない。
  • ワンショット発話を使ってもらう

あたりが望ましいと思います。

そして、同じやり取りの繰り返しは、機械的になってしまってマンネリ化を生みます。ここは簡潔にするというところとのバランスも難しいと思うのですが、

  • 言い方のバリエーションを複数用意しておいてランダムに変える
  • パーソナライズ的な要素を組み込む
    • ユーザの名前をどこかで取得しておいて、発話に含める
    • 時間ごとに挨拶を変える
    • ユーザの過去の発話履歴からユーザが求めそうなものを解析して先んじて提案する(かなり大変だとは思いますが・・・)

ことで、いかにも機械が応答しているという感を減らすのが良いかと思います。

いくつかパターンを用意してみました。

呼び出し名だけでスキルを起動した場合

アレクサ、TVガイドをひらいて

TVガイドスキルです。午後9時現在、放送中の番組は、2チャンネルで「ニュース9時」、4チャンネルで「クイズ◯◯◯」、・・・です。詳細を知りたいチャンネル名を言ってください。

ワンショット発話の場合

アレクサ、TVガイドで4チャンネルについて教えて

(挨拶も省略)午後9時現在、4チャンネルで放送中の番組は「クイズ◯◯◯」です。出演者は✕✕✕、△△△、ゲストは▲▲▲です。(スキル終了)

パーソナライズ

アレクサ、TVガイドをひらいて

◯◯さん、こんばんは、TVガイドスキルです。午後9時現在、4チャンネルで放送中の番組は「クイズ◯◯◯」です。ちなみに8チャンネルで「プロ野球◯◯対△△」もやっていますよ(過去の履歴からプロ野球をよく見ている場合)

ここは色々なパターンがあると思いますので、工夫のしどころですね。

まとめ

色々かんがえてみましたが、かんたんなようでやっぱり難しいですね・・・概ねワンパワーンな感じになりがちですし、長すぎても短すぎてもダメ、その上で次回も使ってもらえるような工夫、と考えるとかなりハードルが高い。

起動時のメッセージは、あくまでもスキルの1要素にすぎないのですが、ユーザが必ず最初に触れる部分、つまりスキルの第一印象を決める部分でもあるので、手を抜かないようにしたいですね。

なお、上記でご紹介したような工夫については以下の記事でもご紹介していますので、興味があればごらんください。