Watson Text to Speech(IBM)

Watson Text to Speech(IBM)とは

IBMが提供しているWatson Text to Speechは、テキストをさまざまな言語の自然な響きの音声に変換することができるAPIクラウド・サービスです。ここでは、Watson Text to Speechの特徴や導入事例、機能などを詳しく紹介します。

各国の言語の音声に変換できる

Watson Text to Speechは、既存のアプリケーションやWatson Assistant内に書かれているテキストを各国の言語で音声にしてくれるサービスです。海外の顧客の母国語に変換することができるので、通訳や翻訳などにかかる費用や手間を省くことができます。

さまざまな場面で活躍する自然な音声

Watson Text to Speechはとても自然な響きの音声に変換してくれるので、カスタマーサービスでの対話の自動化など、さまざまな場面で活用できます。 顧客からの問い合わせにも対応可能で、会話ログを検索することにより新しい通話パターンや顧客の苦情などを正確に特定し、今後のコールセンターサービスの改善に活かすこともできます。

音声合成や音声カスタマイズも自由に

なめらかで自然な音質を自動生成するよう、人の音声を基にトレー二ングされているWatson Text to Speechですが、音声合成マークアップ言語を使用して、発音、ボリューム、ピッチ、速度などのさまざまな属性を簡単に調整することが可能です。

また、朗報や謝罪、疑問などの話し方も指定することができ、 平坦になりがちな音声合成の表現性をコントロールし、まるで人間が話しているかのような表現豊かな話し方に調整することができます。

Watson Text to Speech(IBM)の導入事例

CodeObjects社のケース

アメリカの保険会社向けのコア保険システムを開発しているCodeObjects社では、Watson Text to Speechを導入し、保険契約者からの依頼とデータ処理を自動化することにより、顧客への待ち時間を軽減させることに成功しています。

参照元:IBM株式会社公式HP:https://www.ibm.com/case-studies/codeobjects

Lingmo社のケース

革新的なモバイルアプリや最先端の​​ウェアラブル翻訳デバイスなどの次世代翻訳製品とサービスを提供しているLingmo社は、最大で10週間かかる定期的な翻訳モデルの再トレーニングにWatson Text to Speechを導入したところ、音声認識を強化してほぼリアルタイムで翻訳できるようになり、85%の精度に高めることに成功し、ユーザーへのフィードバックへの応答性が50%高速化するという結果を出しています。

参照元:IBM株式会社公式HP:https://www.ibm.com/case-studies/lingmo-international1

Watson Text to Speech(IBM)の機能

Watson Text to Speech(IBM)のおすすめポイント

Watson Text to Speechは、多言語による自然な響きの音声サポートが可能なAPIクラウド・サービスで、海外の顧客にも母国語で問い合わせに対応することで、カスタマー・サービスの待ち時間を解消することができます。AIを活用した通話やデータ解析も優秀で、社内スタッフへのフィードバックにより業務の改善にも役立ちます。

ニーズ別!業務効率化におすすめな
音声合成ソフトを見る

Watson Text to Speechを制作しているIBMとは

Watson Text to Speechを制作しているIBMは、アメリカに本社を置くテクノロジー関連企業で、世界170か国以上に展開している大規模なIT企業です。事業はコンピュータ関連のサービスおよびコンサルティングの提供、ソフトウェア、ハードウェアの開発・製造・販売・保守などを行っています。

扱っているソフト一覧

Watson Speech to Text

Watson Speech to Textは、機械学習テクノロジーにより、音声をテキストに変換するサービスで、複数の言語で高速かつ正確な音声の書き起こしを可能にしています。

Watson Assistant

Watson Assistantは、さまざまなアプリケーション、デバイス、チャネルにおいて、AI仮想アシスタントを使用して顧客の問題を解決するサービス。会話型AIが迅速で親切な顧客対応をしてくれます。

Watson Discovery

Watson Discoveryは、AIを搭載した検索を使用して、文書とWebサイトから具体的な回答とトレンドを見つけ出してくれるサービスで、調査にかかる時間を75%超削減することができます。

会社概要

目的に合ったものはどれ?
ニーズ別音声合成ソフトのおすすめ3選

音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。

調整が簡単で質の高い
音声合成をしたい

AITalk®
(株式会社エーアイ)
特徴
先端ディープラーニングを導入した独自の技術で、
音質・肉質感の向上、多様な発話表現を実現。
利用シーン
日本語・英語・中国語をメインに、
品質重視のカーナビや館内放送、ニュース読み上げなど

芸能人の声を使った
音声合成をしたい

コエステーション
(コエステ株式会社)
特徴
9万以上の一般ユーザーだけでなく、
40以上に
のぼる有名人などの
豊富な「コエ」の数。
利用シーン
世界観やPR要素重視の
ゲームやYouTube動画など
(エンタメ系)

外国語をメインに
音声合成をしたい

ReadSpeaker
(HOYA株式会社)
特徴
中国語と区別して広東語も。
日本語、英語(アメリカ・イギリス)、韓国語をはじめ、
24言語に対応。
利用シーン
観光案内や美術館の音声ガイダンスと
いった、
外国籍の方の利用が多い場所など

【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。