<コーナー解説>
ITソリューションの導入に関し、背景や動機、選定要素と運用ポイントを聞く事例記事です。
音声認識システム
EX/CX向上、人材育成、VOC活用、自動化
音声認識で実現する5つの改善施策
生成AIの台頭で音声認識システムが注目を集めている。VOCの要約やナレッジ強化などを目的に生成AIを活用するには、応対ログのテキスト化が前提になるためだ。音声認識システムは、すでにモニタリングの自動化やボイスボットの構築などさまざまな用途での事例が多く、生成AIはその価値を高める可能性を秘めている。
通話内容を即時、テキスト化する音声認識システムは、規模の大小を問わず、多くのセンターで運用が加速している。近年、音声認識システムが普及した背景にあるのが、採用難と生成AIの登場だ。深刻化する採用難を受け、企業はこれまで以上に従業員の働きやすさに重点を置き始めている。OpenAIの「ChatGPT」に代表されるテキスト生成AIにおいても、応対業務の効率化やFAQの充実など、CS向上に対する期待が高まっている。コールセンターの場合、生成AIの利点を最大限に発揮するためには、すべての音声データを音声認識システムによってテキスト化し、膨大なテキストデータを用意しておくことが欠かせない。
音声認識エンジンの一般的な仕組みは図1の通り。音声をテキスト変換するには、まず音声から特徴量を抽出する「音響分析」を行い、その特徴量を入力値として「認識デコーダ」によってテキスト化する。
主な音声認識システムの活用用途は、(1)オペレータ支援、(2)品質管理、(3)人材育成、(4VOC活用、(5)オペレーション自動化──の5つ(図2)。テキスト化した後のデータをどのように活用するか明確にし、成果を可視化する仕組みも備えておくことが大切だ。
図1 音声をテキストにするまでの流れ
※画像をクリックして拡大できます
図2 音声認識システムの主な用途
※画像をクリックして拡大できます
記事内で取り上げているベンダー(掲載順)
Hmcomm
アドバンスト・メディア
PKSHA Communication