音声対話

音声対話システムに、音声合成ソフトを採用している企業が増えています。そこでここでは、音声対話システムに音声合成ソフトを活用している企業をまとめて紹介しています。

音声対話の音声合成ソフト事例

成田国際空港の事例

成田空港からリリースされた、世界の空港で初※となる「成田コンシェルNariCo powered by しゃべってコンシェル」に株式会社エーアイの高品質音声合成エンジン「AITalk」が採用されています。「成田コンシェルNariCo powered by しゃべってコンシェル」とは、成田空港が提供している世界初の空港版音声エージェントアプリです。NTTドコモと共同開発を行い、アプリに話しかけると、お客様一人一人のニーズに対応したサービスとして、空港の案内サービスです。このアプリはお客様の話す意図を読み取り、親しみ易いなめらかな声で適切な情報を提供します。この声を高品質音声合成エンジン「AITalk」で作成しています。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1814/)※2022年3月時点。

接客支援ミドルウェアの事例

沖電気株式会社では、アバターを介した音声対話において、バックグランドが対話AIでも友人オペレーターでも、同じアバターとして振舞い接客を行う、接客支援ミドルウェア「CounterSmart」の音声に、コエステ株式会社が提供する音声合成エンジンのコエステーションを採用しています。

参照元:コエステーション公式HP(https://coestation.jp/business/case/)

Sporify(音楽配信サービス)の事例

Sporifyは、ディープニュートラルネットワークを用いたオリジナルボイス開発経験、ブランドボイスに関する深い専門知識を持つ、ReadSpeakerのTTSを採用しています。オリジナルボイスに、ディープラーニングの導入により、音声の品質が向上し、より繊細で自然な感情表現が可能になっています。また、オリジナルボイスでは、お客様ご指定の声優さんの声を基に、声優さんの特徴を活かした音声を作成しています。これらのオリジナルボイス作成に、「ReadSpeakerのTTS」が使われています。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/news/articles/casestudy_20210921-01_Spotify.html)

音声対話とは?

音声対話とは、音声を認識するだけでなく、発話の意図を理解し、考え、適切な回答をする音声対話システムです。音声認識技術に伴い活発に開発が行われ、1990年代には、多くの研究機関がプロットタイプのシステムを開発していました。現在ではAI技術の進化に伴い、発話の意図の理解・推論も向上し、より適切な回答を自然で滑らかな音声で可能になっています。

本サイトでは音声対話としても応用可能な「音声合成ソフト」のおすすめを、ニーズ別に紹介しています。
感情表現が豊かかどうかなど、目的に合うソフトがあるか、ぜひ下記3選をご確認ください。

目的に合ったものはどれ?
ニーズ別音声合成ソフトのおすすめ3選

音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。

調整が簡単で質の高い
音声合成をしたい

AITalk®
(株式会社エーアイ)
特徴
先端ディープラーニングを導入した独自の技術で、
音質・肉質感の向上、多様な発話表現を実現。
利用シーン
日本語・英語・中国語をメインに、
品質重視のカーナビや館内放送、ニュース読み上げなど

芸能人の声を使った
音声合成をしたい

コエステーション
(コエステ株式会社)
特徴
9万以上の一般ユーザーだけでなく、
40以上に
のぼる有名人などの
豊富な「コエ」の数。
利用シーン
世界観やPR要素重視の
ゲームやYouTube動画など
(エンタメ系)

外国語をメインに
音声合成をしたい

ReadSpeaker
(HOYA株式会社)
特徴
中国語と区別して広東語も。
日本語、英語(アメリカ・イギリス)、韓国語をはじめ、
24言語に対応。
利用シーン
観光案内や美術館の音声ガイダンスと
いった、
外国籍の方の利用が多い場所など

【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。