kun432's blog

Alexaなどスマートスピーカーの話題中心に、Voiceflowの日本語情報を発信してます。たまにAWSやkubernetesなど。

〜スマートスピーカーやVoiceflowの記事は右メニューのカテゴリからどうぞ。〜

ChatGPTがすごい!

Voice User Interface Advent Calendar 2022 の2日目です!

Twitterでたまたま流れてきた、これ

純粋な「音声」とはややずれるのですが、音声サービスにおいて言語認識は重要な要素ですし、気になったので少し触ってみました。

目次

ChatGPTとは

GIGAZINEあたりでも記事になっていますが、

  • 高性能言語モデル「GPT-3」の開発元であるOpenAI社の、新しい言語モデルで「対話」に最適化されている。
  • 人間からのフィードバックを元に学習する
  • フォローアップの質問に答える/自分の間違いを認める/間違った前提に挑戦する/不適切な要求を拒否する

というのが特徴です。そういえばAIの回答が危険思想になるということも過去にありましたね。そのあたりの安全性なども含めて、非常に考えられているという印象です。

現在はプレビュー期間なので、OpenAIのアカウントを作れば、誰でも使えるようです。

以下のページの「Try ChatGPT」をクリックして、「Sign up」すればOKです。

やってみた

ChatGPTにアクセスするとこんな感じの画面が表示されます。

真ん中に説明がありますね。

    • 「量子コンピュータを簡単な言葉で説明して」
    • 「10歳の誕生日になにかクリエイティブなアイデアはない?」
    • 「JavaScriptでHTTPリクエストを送るにはどうすればいい?」
  • できること
    • 会話の最初にユーザーが発話したことを覚えている(コンテキストの話ですね)
    • ユーザーによる修正が可能
    • 不適切な要求を拒否するようにトレーニングされている
  • 制限
    • たまに正しくない情報を生成する可能性がある
    • たまに有害な指示や偏った内容を生成する可能性がある
    • 2021年以降の世界やイベントに関する知識が限定的

冒頭で説明した特徴がここでも説明されていますね。

とりあえずやってみましょう。日本語もちゃんと使えます。

まずは例にあるような質問をいくつか。

難しい言葉を訪ねたり、特定の専門分野について効いてみたり、はたまたレシピみたいな一般に近い情報、そしてパーソナルな相談など、いろいろトピックを変えてみたんですが、どれもいい感じで回答してくれますね!これはすごい・・・

次に、コンテキストについて確認してみました(キャプチャの関係上、画像は途中で切っていますが、全部続いています)

途中ちょっとおかしくなってるのはどうも入力時に日本語IMEがきちんと考慮されてないので途中で入力されてしまったためです。気にしなくてオッケーです。ただ会話としては、正しくちゃんとコンテキストを維持しながら続いているのがわかりますね!

さらに、ちょっと間違った情報の場合の修正です。ちょっと長いです。

私の趣味の話にしてしまって、わからない人にはわからない話でほんとすいません。ただ、色々間違った情報を、紆余曲折はありながらも、ユーザからの修正を受け入れて徐々に正確な情報になっていっているのがわかりますね。

意地悪な質問もしてみましょう。

若干負けず嫌い感を感じますねw

最後に答えてくれない例をあげましょう。

ちょうど今ワールドカップやっていますが、当然2022年の情報はないのと、どちらが勝つ・強いみたいなのには答えてくれないみたいですね。

これ以外にもTwitter上でみなさんいろいろ試していて、面白いやり取りもあるようなので見てみてください。

まとめ

ChatGPTスゴイです。機械学習とはいえ、ちゃんと文脈を意識しているように感じれるぐらいのレベルです。このレスポンスをそのままTTSに渡せば、ちょっとした音声アシスタントはそれだけでできちゃいそうですね。

個人的には、音声アシスタント開発者として考えるならば、何かしら目的を持ったアシスタントの場合に、自分たちの対話モデルとどう併用させるか?とか考えてしまうのですが、例えばAlexa Conversationsの後ろでこういうのを使えば、対話モデルの設計がかなり楽になるんじゃないかなーとかちょっと妄想しています。

OpenAIのアカウントを作れば誰でも試せますので、興味が有る方はぜひ。