kun432's blog

Alexaなどスマートスピーカーの話題中心に、Voiceflowの日本語情報を発信してます。たまにAWSやkubernetesなど。

〜スマートスピーカーやVoiceflowの記事は右メニューのカテゴリからどうぞ。〜

Alexa Conversationsのチュートリアルをやってみた② context carry-overを使ったUser correction

f:id:kun432:20200809103200p:plain

前回に続いてAlexa Conversationsのチュートリアルの続きです。

今回は、"context carry-over"を使った"User correction"に対応してみたいと思います。

目次

"context carry-over"と"User correction"

"context carry-over"と"User correction"とはそもそも何か?会話のサンプルを見てもらえばわかりやすいかと思います。

Alexa, open pet match.
(アレクサ、ペットマッチをひらいて)

Welcome to pet match. I can find the best dog for you. What are two things you’re looking for in a dog?
(ペットマッチにようこそ。あなたにピッタリの犬を教えます。あなたが求める犬の条件を2つ教えてください。)

I want a large family dog.
(大きくて、家族になれるのがいいな)

Do you want a high-energy or low-energy dog?
(活発なのとおとなしいのではどちらがいいですか?)

Low.
(おとなしいやつ)

I recommend a Great Pyrenees.
(それならグレート・ピレニーズがおすすめです。)

(hmm...Great Pyrenees is too big for us...)how about a medium sized dog?
グレート・ピレニーズかぁ…ちょっと大きすぎるかな…中型犬だとどう?)

Ok, after changing large to medium, I recommend an American Eskimo.
(わかりました、大型犬から中型犬に変更するなら、アメリカン・エスキモー・ドッグがおすすめですね。)

最後の2つの発話のところですね。

  • すべての質問を繰り返すことなく
    • つまりコンテキストを引き継いでいる。これがcontext carry-over
  • サイズだけ置き換えて再度回答する
    • 新しいスロット値を置き換えている。これがUser correction

ダイアログモデルで同じことをする場合、dialogStateがCOMPLETEDになるとこれらの情報がなくなってしまうので、必要な場合はセッションアトリビュートなどを活用しないといけないため手間がかかるようですが、このあたりが標準的に想定されているのがAlexa Conversationsのメリットかと思います。

では早速やってみましょう。

ダイアログの変更

ではダイアログを変更してみたいと思います。Alexa ConversationsのDialogsをひらいて、dialog0を変更していきましょう。

f:id:kun432:20200816005037p:plain

以下の会話を追加します。

U: How about a medium sized dog?
A: Ok, after changing large to medium, I recommend an American Eskimo.

f:id:kun432:20200816005906p:plain

ではスロットを設定しましょう。ユーザの発話の"medium"をスロットタイプ"size"と紐付けます。変数名がちょっと違いますね、1行目でスロットをセットしたときは"size0"でした。ここは後でわかります。

f:id:kun432:20200816010035p:plain

続けて、ユーザの発話にダイアログアクトを指定します。ここは"Invoke APIs"を選択します。もう一度マルチターンが始まる感じがしますね。

f:id:kun432:20200816010259p:plain

発話セットです。sizeのみのinvokeを処理するAlexa側の発話セットを指定します。つまり、"invoke_getRecommendationSize"になります。

f:id:kun432:20200816010650p:plain

スロットを変数に入れます。ここでは"slot1"でサイズを受け取っているので"slot1"を選択します。

f:id:kun432:20200816010837p:plain

これでユーザの発話は終了です。一旦保存しておきましょう。Alexa Conversationsではマメに保存したほうがいいですね。ビルドはまだしなくてよいです。

f:id:kun432:20200816011008p:plain

次にAlexaの発話です。

まずダイアログアクト、APIの結果を返す部分の発話なので、"Notify Success"を選択します。

f:id:kun432:20200816011215p:plain

APIを設定します。"getRecommendation"ですね。

f:id:kun432:20200816011326p:plain

APIに渡す引数にどの変数を割り当てるかを設定していきます。以下の通り設定します。

f:id:kun432:20200816011723p:plain

注意しないといけないのは、ここでAPIの引数"size"に割り当てるのは新しく追加した"size1"ということですね。このダイアログでいうと、1行目のユーザの発話時点でsize0に変更前のsizeが入っています。size1は5行目の発話で受け取ったユーザが変更したsizeスロットを指す変数です。それに対し、つまり古い情報はこのセッションの中で記憶されていて、新しい情報と組み合わせて、再度APIにリクエストを送るということになるわけですね。

f:id:kun432:20200816012335p:plain

また、return Type -> Variablesのところも"getRecommendationResult1"になっています。4行目では"getRecommendationResult0"になっていました。つまりAPIレスポンスも前回とは別の新しい変数として受け取るようにしておけば、前回の結果を保持できるということですね。

f:id:kun432:20200816012635p:plain

で、最後にレスポンステンプレートです。ここは4行目と同じ"notifySuccess_getRecommendation"を使うこともできるのですが、コンテキストを維持しているということがわかるように別のレスポンステンプレートを作りましょう。"Create New Response"を選択します。

f:id:kun432:20200816012928p:plain

この場合は、レスポンステンプレートのメニューに行かなくても、シームレスに作成ができるみたいですね。"notifySuccess_getRecommendation_context_carry_over"というレスポンステンプレート名にします。

f:id:kun432:20200816035952p:plain

で下にスクロールして、レスポンステンプレートに渡す引数を設定していきます。"Add a new argument"をクリックして、以下の3つの引数を作成してください。

f:id:kun432:20200816040227p:plain

ここで3つの引数を作成したのは、このダイアログの発話を見てもらえればわかるかと思います。

A: Ok, after changing large to medium, I recommend an American Eskimo.

つまり、ここにスロットを当てはめるとこうなります。

A: Ok, after changing {oldSize} to {newSize}, I recommend a {getRecommendation.name}.

変更前のサイズと変更後のサイズ、そして結果セットの名前がAlexaからのレスポンスとして返されるので、これを引数として指定するわけですね。

もうおわかりかと思いますが、これをレスポンステンプレートの発話として登録していけばよいですね。上にスクロールして"Audio Response"のドロップダウンから"Create a new prompt"を選択します。

f:id:kun432:20200816040916p:plain

プロンプト名も"notifySuccess_getRecommendation_context_carry_over"にします。

f:id:kun432:20200816043013p:plain

レスポンステンプレートのメニューから新規作成ではなく、ダイアログ内からレスポンステンプレートを作るとダイアログの発話がそのまま入っちゃうのですね。こっちのほうがスロット割り当てもそのままできるのでいいかもですね。では発話の部分をスロットに置き換えていきましょう。そろそろ慣れてきましたよね。

f:id:kun432:20200816043144p:plain

こんな感じになっていればOKです。「保存」して「Save」してください。

f:id:kun432:20200816043300p:plain

ダイアログの画面に戻って、テンプレートが必要とする引数にどの変数を割り当てるかを設定します。一番下はちょっと見えないですが、2回目のAPIリクエストの結果をレスポンステンプレートに渡すので、上のAPIの結果が入っている"getRecommendationResult1"を選択してください。

f:id:kun432:20200816043757p:plain

で、最後にもう一つ。API定義にレスポンステンプレートを紐付けます。前回やったときは特に意識してなかったんですが、これなんでやらないといけないんでしょうね・・・ダイアログが中心になって他のコンポーネントを紐付けるのに、コンポーネント同士を紐付ける意味がわからないな・・・ま、とりあえず、APIの横の鉛筆アイコンをクリックします。

f:id:kun432:20200816142449p:plain

"getRecommendation" のAPI定義が開きます。下の方にあるレスポンステンプレートで "notifySuccess_getRecommendation" が紐付いていると思うんですが、ここに "notifySuccess_getRecommendation_context_carry_over" も追加して、「保存」します。

f:id:kun432:20200816142751p:plain

これで終了です。「Save」「モデルをビルド」をクリックしてビルドします。

f:id:kun432:20200816143046p:plain

テスト

こんな感じでうまくいきました。

f:id:kun432:20200816145328p:plain

違うダイアログのパターンでも動作しますね。

f:id:kun432:20200816145548p:plain

ただ、他のスロットの言い換えは別途設定しないといけないようです。

f:id:kun432:20200816145852p:plain

まとめ

前回のチュートリアルで一通り触ったので、correctionはすんなり理解できたような気がします。これはとても便利ですね。

チュートリアルはまだ続きます。次回はさらに別のAPIに情報を渡して会話を続けます。