kun432's blog

Alexaなどスマートスピーカーの話題中心に、Voiceflowの日本語情報を発信してます。たまにAWSやkubernetesなど。

〜スマートスピーカーやVoiceflowの記事は右メニューのカテゴリからどうぞ。〜

VUI Design

ChatGPTがすごい!

Voice User Interface Advent Calendar 2022 の2日目です! Twitterでたまたま流れてきた、これ OpenAIから対話に最適化された言語モデル「ChatGPT」が公開! https://t.co/FpvVUbrjpoフォローアップの質問をしたり、間違いを認めたり、間違った前提に異議を…

LipSurfで自作プラグインを作ってブラウザの音声操作を拡張する① 〜Hello Worldプラグイン〜

この記事は、Voice User Interface Advent Calendar 2022 の1日目の記事です。 前回の記事で紹介した音声でブラウザを操作できる「LipSurf」ですが、プラグインによる音声操作の拡張が可能です。 標準でもいくつかプラグインがインストール済になっています…

ポエム:スマートスピーカーの終焉報道について

ここ最近、スマートスピーカー関連についてなかなか厳しいニュースが続いています。 個人的には「ついに来たか」というのが一番最初に感じたことではあるのですが、これについていろいろ思うところを書き綴ってみたいと思います。多分に自戒を込めた感じで。…

GPUがなくても高速に音声認識ができるwhisper.cppを試してみる

ちょっと前に、かんたんに高精度な音声認識ができるWhisperが話題でしたが、そもそもそんな高性能GPUうちにはなく、盛大に出遅れていたのですが、 GPU不要・CPUでも「高速」に動作するWhisper CPPがあるということで、手元の環境で試してみました。 目次 目…

LipSurfを使った音声によるブラウザの操作を試してみた

ふと思いついてブラウザでの音声コントロールについて調べてたら、こんなのを見つけたので早速試してみました。 目次 目次 LipSurfとは LipSurf Chrome拡張のインストール LipSurfの音声認識のON・OFF その他の操作 まとめ LipSurfとは ブラウザを音声でコン…

Amazon Lex の Visual Conversation Builderを試す ①ハローワールドな会話フロー

随分とブログの更新もご無沙汰してしまっておりますが、いろいろあって今月からまたガツガツ再開していきたいと思います! ということで久々のネタは、Amazon Lexで以下のニュースから。 ざっくり言ってしまうと、Amazon LexでVoiceflowのようなGUIで会話フ…

音声・言語系プラットフォームのビルトインなスロット/エンティティタイプを比較してみた

対話モデルを作成する場合、インテントにせよ、スロット/エンティティにせよ、自前で値を用意するのはけっこう大変です。可能な限り、プラットフォーム側で予め定義されたものがあるほうが便利ですよね。 ということで、各音声・言語系サービスのビルトイン…

AlexaスキルのテストをBotiumでやってみた①

Alexaスキルのテスト、どうしてますか?色々やり方はあると思います。 Alexa開発者コンソールのテストシミュレータ ベータテストを使った実機テスト ask dialogコマンド mocha/chai/jestなどによるユニットテスト テスト用フレームワーク alexa-conversation…

Romiシナリオエディターを試してみた

実はうちではAlexaよりも一番よく使っているといってもいい「Romi」ですが、「シナリオエディター」を使ってユーザが会話をプログラミングできるようになりました。Alexaなどの音声アシスタントを触ったことのある開発者の観点で、すこしご紹介します。 目次…

#VUIchallenge #021 - Stories & SSML

#VUIchallengeの第21回です。テーマは「Stories & SSML」。 過去の#VUIchallengeの記事はこちら お題 前提 デザイン キャラクターの会話 voiceタグ prosodyタグ 効果音 BGM まとめ お題 The challenge Using TTS voice only, what SSML tags would you use f…

#VUIchallenge #020 - Desserts and lists

#VUIchallengeの第20回です。テーマは「Desserts and lists」。 過去の#VUIchallengeの記事はこちら お題 前提 会話のゴール 想定されるユーザのペルソナ いつどこで使われるか? どのデバイスで使われるか? スキルの特徴・個性は? ビジュアル デザイン デ…

#VUIchallenge #019 - Farts...

#VUIchallengeの第19回です。テーマは「Farts...」。 過去の#VUIchallengeの記事はこちら お題 前提 会話のゴール 想定されるユーザのペルソナ いつどこで使われるか? どのデバイスで使われるか? スキルの特徴・個性は? ビジュアル デザイン バリエーショ…

#VUIchallenge #018 - Sound experience

#VUIchallengeの第18回です。テーマは「Sound experience」。 過去の#VUIchallengeの記事はこちら お題 前提 1. 「睡眠」のためのサウンドスキル 会話のゴール 想定されるユーザのペルソナ いつどこで使われるか? どのデバイスで使われるか? スキルの特徴…

#VUIchallenge #017 - Math Quiz

#VUIchallengeの第17回です。テーマは「Math Quiz」。 過去の#VUIchallengeの記事はこちら お題 前提 会話のゴール 想定されるユーザのペルソナ いつどこで使われるか? どのデバイスで使われるか? スキルの特徴・個性は? ビジュアル デザイン 基本 楽しく…

#VUIchallenge #016 - Watering plants

#VUIchallengeの第16回です。テーマは「Watering plants」。 過去の#VUIchallengeの記事はこちら お題 前提 会話のゴール 想定されるユーザのペルソナ いつどこで使われるか? どのデバイスで使われるか? スキルの特徴・個性は? ビジュアル デザイン 初回 …

#VUIchallenge #015 - Say my age

#VUIchallengeの第15回です。テーマは「Say my age」。 過去の#VUIchallengeの記事はこちら お題 デザイン イレギュラーなパターン うるう年 年がない場合 年・月・日を別々に取得して、個別にチェックする場合の注意 まとめ お題 The challenge Design a sa…

#VUIchallenge #014 - Food trucks

#VUIchallengeの第14回です。テーマは「Hotel checkout」。 過去の#VUIchallengeの記事はこちら お題 デザイン まとめ お題 The challenge Improve the following interaction for a food truck voice experience. "I suggest you the Gran Kahuna hamburger…

#VUIchallenge #013 - Geolocation

#VUIchallengeの第13回です。テーマは「Hotel checkout」。 過去の#VUIchallengeの記事はこちら お題 デザイン ルート案内/ナビゲーション マラソンアプリ 動物園・水族館のナビゲーション その他のアイデア まとめ お題 The challenge Brainstorm at least …

#VUIchallenge #012 - Hotel checkout

#VUIchallengeの第12回です。テーマは「Hotel checkout」。 過去の#VUIchallengeの記事はこちら お題 デザイン Proactive or Reactive? オフラインのアクション チェックアウト時の会話フロー まとめ お題 The challenge Design a checkout experience for …

#VUIchallenge #011 - Training

#VUIchallengeの第11回です。テーマは「Training」。 過去の#VUIchallengeの記事はこちら お題 前提 デザイン 認知的な負荷 ビジュアルのない説明 まとめ お題 The challenge Think about a HIIT training and design the explanation for the full 15 minut…

#VUIchallenge #010 - Info details and SSML

#VUIchallengeの第10回です。テーマは「Info details and SSML」。 過去の#VUIchallengeの記事はこちら お題 デザイン ユーザの本当の目的を考える 情報を絞る もっと聞きやすくする 別のアプローチ まとめ お題 The challenge Create an interaction where …

#VUIchallenge #009 - Multi-turn experiences

#VUIchallengeの第9回です。テーマは「Multi-turn experiences」。 過去の#VUIchallengeの記事はこちら お題 デザイン 言葉遣い マルチターンの難しいところ マルチターンの実装 マルチターンが必要になるユースケース まとめ お題 The challenge Create a m…

#VUIchallenge #008 - Use cases with lists

#VUIchallengeの第8回です。テーマは「Use cases with lists」。 過去の#VUIchallengeの記事はこちら お題 デザイン クイズ 曜日を扱うもの サブウェイの注文(笑) まとめ お題 The challenge Create a list of use cases where lists of items are crucial…

#VUIchallenge #007 - Welcome back Message

#VUIchallengeの第7回です。テーマは「Welcome back Message」。 過去の#VUIchallengeの記事はこちら お題 デザイン 異なる体験を提供する いつから慣れたユーザだと判断するか? ヒントを提供する 別の言い方を提案する エラーになったときやヘルプ サジェ…

#VUIchallenge #006 - Confirmations

#VUIchallengeの第6回です。テーマは「Confirmations」。 過去の#VUIchallengeの記事はこちら お題 デザイン ダメな例 コンテキストを全く意識しない 融通が利かない いくつかのアプローチ できないことをきちんと説明する コンテキストをきちんと管理する …

#VUIchallenge #005 - Success confirmation

#VUIchallengeの第5回です。テーマは「Success confirmation」。 過去の#VUIchallengeの記事はこちら お題 デザイン サウンドを使う 表現のバリエーション 確認を要求する まとめ お題 The challenge Create 3 different success confirmation prompts for u…

#VUIchallenge #004 - Utterance collection

#VUIchallengeの第4回です。テーマは「Utterance collection」。 過去の#VUIchallengeの記事はこちら お題 デザイン まとめ お題 The challenge Users can refer to the same service in many different ways. That's the magic of conversational interacti…

#VUIchallenge #003 - The Lists

#VUIchallengeの第3回です。テーマは「The Lists」。VUIにとっては難しいテーマですね・・・ 過去の#VUIchallengeの記事はこちら お題 デザイン 各タイトルで共有されている情報量 お客様の目的:お客様は多くの結果を得たいのか、それとも1つのお勧めを得た…

#VUIchallenge #002 - The cities

#VUIchallengeの第2回です。テーマは「The cities」。 過去の#VUIchallengeの記事はこちら お題 デザイン 都道府県が違うけど都市名が同じ 外国の都市名 その他のシナリオ まとめ お題 The challenge Design a prompt asking users to tell the city in the …

#VUIchallenge #001 - Welcome Message

#VUIchallenge というのを知っていますか? Amazon Alexa AutoのVUI&UXデザイナーであるJesús Martínさんによる企画で、毎日1問、VUIに関するお題が与えられて、それに対するデザインやソリューションを考えて、みんなでシェアしよう!という取り組みです…