kun432's blog

Alexaなどスマートスピーカーの話題中心に、Voiceflowの日本語情報を発信してます。たまにAWSやkubernetesなど。

〜スマートスピーカーやVoiceflowの記事は右メニューのカテゴリからどうぞ。〜

#VUIchallenge #003 - The Lists

f:id:kun432:20210711001052p:plain

#VUIchallengeの第3回です。テーマは「The Lists」。VUIにとっては難しいテーマですね・・・

過去の#VUIchallengeの記事はこちら

お題

The challenge

Design a list for your service. Your VUI interface gives movie recommendations from a catalogue of hundreds of titles. Each title is associated with rich information like actors, year, rating, etc. You can decide how many titles you want to list in a row, and what's the information you are going to include for each title.

Jesús' Tips

When listing items you need to be super cautious with cognitive overload. Cognitive load can vary from one user to another and it will depend on many different aspects. Here you have some ideas you can consider:

  • Amount of information shared for each title.
  • Familiarity with the results.
  • Customer goal: do customers want to get many results or just a single recommendation?

DeepLによる日本語訳

課題

お客様のサービスのためのリストをデザインしてください。あなたのVUIインターフェースは、何百ものタイトルのカタログから映画をお勧めします。それぞれのタイトルには、俳優、製作年、評価などの豊富な情報が関連付けられています。一列に並べるタイトルの数と、各タイトルに含める情報を決めることができます。

Jesúsのヒント

アイテムをリストアップする際には、認知的過負荷に細心の注意を払う必要があります。認知的負荷は、ユーザーによって異なりますし、さまざまな側面に依存しています。ここでは、いくつかのアイデアを考えてみましょう。
たとえ言葉遣いが完璧であっても、さまざまなシナリオに対応できるようにしておく必要があります。ここではいくつかのアイデアをご紹介します。

  • 各タイトルで共有されている情報量。
  • 結果に対する親しみやすさ。
  • お客様の目的:お客様は多くの結果を得たいのか、それとも1つのお勧めを得たいのか?

デザイン

最初に「認知的負荷」について考えてみましょう。

上記のサイトの説明を見てもらうとわかるように、人間が一度に覚えれる情報の量は限られています。ここに限界以上の情報を与えるとオーバーフローします。これが「認知的過負荷」です。

音声インタフェースにおいては、耳できいたことを頭で覚えるということが必要になります。そして「リスト」のような大量の情報を音声だけで一度にユーザにわたすというのは、ユーザの記憶力に対して大きな負荷をかける行為になるため、とても相性が悪いです。

実際にサンプルのフローで体験してみましょう。

ムービーレコメンドスキルです。
このスキルでは、あなたの好みに合わせておすすめの映画をご紹介します。お好きな映画のジャンルを言ってください。

ラブコメかな。

わかりました。あなたにおすすめのラブコメ映画を100件ご紹介します。ユー・ガット・メール、あなたが寝ている間に、ウェディング・シンガー、・・・の100件です。詳しく聞きたい映画のタイトルを言ってください。

はい、100件なんて覚えられないですよね・・・しかも多分これは読み上げるのにもかなりの時間がかかるのではないかなと思います・・・

じゃあ10件なら行けるか?多分無理でしょう。Alexa音声デザインガイドにもありますが、一度に選択できるのはせいぜい3つ程度です。それ以上は聞いても忘れますし、ユーザは興味を失うでしょう。

そこでお題に上がっている、アイデアのいくつかについて考えてみましょう。

各タイトルで共有されている情報量

情報量が多いのはタイトルだけではありません。個々の映画の詳細情報についても同じです。

  • 監督
  • 出演
  • 脚本
  • 公開年度
  • 評価
  • カテゴリ
  • あらすじ

詳細な情報を沢山伝えようとすればするほど、音声で伝えないといけないことの量と時間が増え、そしてユーザの認知的負荷も高くなります。

さきほどのサンプルスキル、10件覚えるのも大変ですけど、なんとか一つの映画についてユーザが訪ねたとしましょう。

ユー・ガット・メールについて教えて

ユー・ガット・メールは、1998年に公開されたロマンティック・コメディです。インターネットで知り合った名前も知らない男女がメールのやり取りをしながらお互いに惹かれ合っていくというストーリーです。監督ノーラ・エフロン、脚本ノーラ・エフロン、デリア・エフロン、出演トム・ハンクス、メグ・ライアンです。インターネット・ムービー・データベースの評価は6.7です。

多分こんな感じの情報をお伝えすることになると思いますが、これも長いですよね・・・

お客様の目的:お客様は多くの結果を得たいのか、それとも1つのお勧めを得たいのか?

このように多くのリストやデータベースから情報を抽出するというのは、音声インタフェースにとってはとても難しいです。

でも少し考えてみてください。

そもそもユーザは音声でそれをもとめているのでしょうか?これってパソコンやスマホでも良い、というかむしろそっちのほうが使い勝手が良くないですか?本当にユーザは音声でデータベース検索みたいなことをやりたいと思っているのでしょうか?

考え方としては2つになると思います。

  • やっぱりユーザは多くのオススメを求めている
    • 音声だけでは難しいので、何かのアシストが必要
  • そうではなくて、ユーザは一つのオススメを知りたい
    • 音声の制約を逆手に取ったアイデアで勝負
    • やれることは少ないけど、シンプルな目的を使い勝手よく果たす

前者については、「画面付きデバイスを使って音声と併用する」というやり方があります。つまり「GUI」ですね。

パソコンやスマホのように、GUIでは大量の情報を一度に表示できますし、メニューのような階層構造やページネーションなどを使って表示する情報を切り替えたりもできます。そして音声のように一定時間に回答しないといけないということもなく、タッチやマウス操作で見たい情報を見ることができますね。

参考までにAmazon PrimeビデオをEcho Showで開くとこうなります。

f:id:kun432:20210714231320j:plain

ひと目でわかりやすいですし、ここから選択する場合、タッチでもいいでしょうし、音声でも良いでしょう。

後者の場合、そもそも根本的に大量の情報を返すことは諦めます。音声のメリットを活かす、逆に言うと音声の制約を逆手に取って、アイデア and/or 使い勝手で勝負することになります。

例えば、こんな感じ。

  • 一つのテーマに特化した形で提案
    • カンフー映画専門のおすすめ、とか。
    • テーマを広く扱わないかわりに、かなりマイナーな映画も扱っているとか、そのジャンルの専門家によるおすすめ、といったプラス要素が必要。
  • ユーザの想定を「いい意味」で裏切る形での提案(セレンディピティ)
    • 普段見ないような、でも一度見ると必ずハマるような「新しい出会い」を提案
    • ユーザの反応が良ければいいが、おそらく確率は低くなる
  • ユーザの個人的な嗜好にあわせた提案(パーソナライズ)
    • おすすめに対する結果を反映して、徐々にユーザの嗜好に寄せていく(パーソナライズ)
    • 以下にユーザの期待に沿った提案ができるかが鍵

映画自体がビジュアルなものであること、そして、非常に多くの情報を持っている、というところで、音声だけで勝負するには何かしらの工夫が必要かなという気がします。

ということで、最初のサンプルスキルをブラッシュアップしてみました。

ムービーレコメンドスキルです。
このスキルでは、あなたの好みに合わせておすすめの映画を3本ご紹介します。お好きな映画のジャンルを言ってください。

ラブコメかな。

わかりました。今回のおすすめは、ユー・ガット・メール、あなたが寝ている間に、ウェディング・シンガー、の3本です。興味があるものを言ってください。 f:id:kun432:20210715000514j:plain

ユー・ガット・メール(「1番」といってもいいし、画面タッチでもOK)

インターネットで知り合った名前も知らない男女がEメールのやり取りをしながらお互いに惹かれ合っていくというストーリーです。まあまあおすすめです。 f:id:kun432:20210715001813j:plain

まとめ

今回、対話のデザインという点では、少し脱線していますが、リスト的なものはやっぱり音声には鬼門ですね。やはり、画面付きデバイスをうまく使って多くの情報を提供しつつも、音声ならではのメリットを活かすような使い方を考えるべきですね。