これでできる!Amazon Connectの音声データを生成AIで活用する方法 - サーバーワークスエンジニアブログ

これでできる!Amazon Connectの音声データを生成AIで活用する方法

記事タイトルとURLをコピーする

「電話で話した会話のデータを生成AIで活用してみたいんだけど、どうすればいい?」
そんな相談を受けたことはありませんか?

電話の会話をデータ化して分析すれば、顧客のニーズや感情を深く理解できるチャンスが生まれます。
でも、いざ実現しようとすると、

  • どのデータを使えばいいのか?
  • 音声データをどうやって取り出して処理するのか?

など、具体的な進め方がわからず迷ってしまうことも多いはず。
そんな疑問を解消するために、このブログでは Amazon Connect を使った会話データ収集方法と、生成AIでの活用アイデアを解説します。
AWSや生成AIには詳しいけど、Amazon Connectは初めて、という方にもわかりやすくご紹介します。

Amazon Connectとは?

Amazon Connectは、AWSが提供するクラウド型のコンタクトセンターサービスです。
AWSのサービスならではの拡張性が大きな魅力の一つです。
通話や会話データが自由に利用できます。
生成AIとの組み合わせで新しい取り組みができる可能性が広がります。

たとえば、こんなことが実現できます:

  • 通話データをリアルタイムでテキスト化して分析
  • 会話の内容から顧客の感情やニーズを自動抽出
  • 会話データを生成AIにかけて、次の提案や要約を自動作成

これから、会話データの種類ごとの収集方法を解説していきます。

会話分析データを収集する方法

会話のテキストがあれば分析はできるのがわかる。
問題は電話の音声をどうやってテキストにして取得できるのか。
Amazon Connectになじみのない方にとってよくわからない部分はここなのはないでしょうか。

結論からお伝えすると「Contact Lens を活用すれば一番簡単!」なのですが、要件次第だったりもするので順を追ってご説明します。

Amazon Connectでは、以下の3つのデータ形式を利用できます。
それぞれの特徴と使い方を見ていきましょう。

1. 会話音声データ(WAV形式)

Amazon Connectは通話録音をする機能を有しています。
コンタクトフローの中で「通話録音」を有効化すると利用できます。
通話終了後少しすると Amazon S3 に録音ファイルが自動的に生成されます。
録音データはwav形式で話者(顧客/エージェント)が左右に分離されて保存されます。

音声ファイルからテキスト化するためには、AWSであれば Transcribeを利用することができます。
Complehendを組み合わせればちょっとした分析も可能です。
AWS以外のサービスを利用することももちろん可能です。

2. 会話(音声)のストリームデータ

Amazon Connectは会話をストリーミングデータとして提供することができます。
コンタクトフローの中で「メディアストリーミングの開始」を設定することで、Kinesis Video Streamを利用して音声をストリーミングされます。
S3に保存される通話録音と異なり、ほぼリアルタイムで提供されるのが大きな魅力です。

ストリーミングデータからテキスト化するためには、いくつかの方法があります。
ここではAWSの提供している情報をご案内します。
docs.aws.amazon.com

3. コンタクト分析データ(JSON形式)

一番手軽でおすすめの方法が、この「コンタクト分析データ」の活用です。

Amazon Connectは有償オプションサービスとして Contact Lens for Amazon Connect を提供しています。
AWSのお言葉を拝借すると「コンタクトセンターの顧客のインサイトを明らかにするための ML 音声分析機能のセット」です。

あわわ、ちょっとまって、あきらめないでください。
もうちょっとかみくだきます。

音声のテキスト化、要約、コンタクト分析情報などをワンセットで提供します。
コンタクト分析情報は、総通話時間/通話以外の時間/感情分析などを含みます。
今日は詳しく述べませんが「要約、感情分析」というと夢を抱く方も多いかと思いますが、現実には色々あるという点は含みおきください。

コンタクトフローの中で「Contact Lens の会話分析」を有効化することで分析が可能です。
分析結果の見方や活用法はいろいろあるのですが、今回は「生成AIで分析」という視点にフォーカスします。
通話切断後少しすると分析結果ファイルがS3に生成されます。

分析結果ファイルはJSON形式となっており、会話のテキストはもちろん、通話時間などの分析情報も付加されています。
ファイルフォーマットについてはドキュメントがわかりやすいのでご参照ください。
docs.aws.amazon.com

Contact Lensの設定は「リアルタイム」と「バッチ」の2種類があります。
「リアルタイム」を選択した場合は、会話の途中でもAPI経由で情報を取得することも可能です。
docs.aws.amazon.com

これを読んでいるみなさまは、テキストが取り出せれば事足りると思いますが、もしContact Lens for Amazon Connect をもっと詳しく知りたい方は動画もどうぞ。

youtu.be

会話分析に利用できるデータの種類まとめ

収集方法は全部で3種類。
要件によりけりだけど、Contact Lensを有効化して分析データファイルを利用する、から検討するのがよいと思います。
S3に会話テキストを含むJSONファイルがあれば、みなさんならもうあとは好き放題ジェネレートしちゃえますよね。

活用アイデア

会話データが手に入ったら、生成AIを活用して以下のような分析や改善が可能です。

1. トレンド分析

顧客から寄せられる問い合わせ内容を分析し、トレンドを把握。これにより新商品の企画やサービス改善に活かせます。

2. 顧客インサイトの抽出

生成AIを使って会話の中から重要な要望や不満点を抽出。たとえば「よくある質問」の更新や対応ポリシーの改善に役立てられます。

3. 要約生成

通話終了後に要約を自動生成し、CRMシステムに登録。エージェントの作業負担を軽減できます。

4. FAQの改善

過去の会話データをもとに、新しい質問と回答を生成。チャットボットやFAQシステムの精度向上が期待できます。

5. 離脱率やエスカレーション率の低減

エスカレーションが起きるパターンを分析し、対応方法を改善することで、顧客満足度を向上。

まとめ

Amazon Connectを活用すれば、電話の会話データをこれまで以上に効果的に利用できます。生成AIとの組み合わせにより、顧客の期待に応えるサービスや業務効率化が実現可能です。 みなさまはどんな生成AI活用をお考えなのでしょうか。
サーバーワークスには、Amazon Connectや生成AIに精通したプロフェッショナルがそろっています。
あなたのアイデアを実現するお手伝いができるのを楽しみにしています!

丸山 麻衣子(記事一覧)

Amazon Connect 専任担当
Amazon Connect の情報をお探しの方はこちらもどうぞ