【PR】※音声あり※
音声合成ソフトの品質を
確かめてみた

近年の音声合成ソフトは、今まで感じていた機械っぽさがほとんどなく、まるで本当に人が話しているかのような滑らかな仕上がりが期待できるものになりつつあります。年々需要が高まっている音声合成ソフトですが、DNN音声合成方式だとか、波形接続型音声合成方式だとか、「方式についての説明を聞いてもよくわからない。」といった方もいらっしゃるのではないでしょうか。そこで重要なのは性能と実際の使いやすさ
ここでは、設立以降改良を重ねたソフトの導入実績が1,200社以上※を誇る、音声合成ソフトAITalk®の気になる品質や特徴を特集しています。 ディープラーニングを活用したDNN音声合成方式エンジン採用のAITalk®とは、どんなものなのでしょうか。

参照元:エーアイ公式HP:https://www.ai-j.jp/202011lp/ 2022年3月時点。

AITalk®とは

DNN音声合成方式により
なめらかな感情表現が実現

AITalk は株式会社エーアイが提供しており、先端技術の深層学習(ディープラーニング)を活用した「DNN音声合成方式」を採用しています。DNN音声合成は人間の脳に近づけたAI技術の一つで、省力でありながら高い処理能力を持っており、従来の音声合成では解決できなかった不自然な感情表現を低減。そのためより自然な喜怒哀楽を音声化できます。
また、日本語解析方式の変更により、入力されたテキスト、特に漢字の読み間違いやアクセント間違いのリスクが少なくなりました。

18名の日本語話者から選択可能!
外国語は41言語対応

AITalkでは、大人から子どもまで総勢18名の日本語話者が選択できるため、利用目的や利用シーンに適した声が見つかるでしょう。方言にも対応しており、標準語と関西弁の2種類から選択できます。公式HPには、各キャラクターの声が視聴できる専用テキストも用意されているので、音声合成ソフトの声を確かめたい方は、公式HPをチェックしてみてはいかがでしょうか。
また、外国語は、英語や中国語のほか、タミル語、ウクライナ語、フィンランド語など、世界各国41の言語に対応しています。英語は、「アメリカ英語」「イギリス英語」「オーストラリア英語」のように、イントネーションの若干の違いにも対応しうる細かい設定が可能です。

音声合成に特化した会社!
音声全般の相談が可能

AITalkの生みの親である株式会社エーアイは、音声合成専門の会社という強みもあります。2003年に設立以降、音声合成の提案・開発・販売すべてを自社でおこなっています。また、音声全般の豊富な知識があるので、音声合成に限らずさまざまな視点からの「音」に関するアドバイスができるのも魅力です。
音声合成ソフトの導入を検討されている方は、些細な悩みであっても、一度ご相談してみるのも良いかもしれません。

AITalk®の
実際の音声サンプル

使い勝手の良い特徴があるのはお分かりいただけたと思いますが、やはり気になるのは実際の音声の質。そこで今回、社内向け研修を想定した音声サンプルを用意しました。DNN音声合成方式により、滑らかで豊かになった感情表現は必聴です。ぜひ聞き比べてみてください。

  • DNN音声合成方式
  • DNN(Deep Neural Network)というAI技術の応用で、少ない労力でデータ処理が高速化されるニューラルネットワーク(脳内の神経回路を模した数学モデル)を用いて合成する方法。
    これにより、従来の音声合成手法より自然な感情表現が可能に。

  • 波形接続型音声合成方式
  • 録音された音声の素片を連結して合成する方法。
    録音された音声の素片(切り分けられた音声波形)を利用するため、入力テキストに近いものが録音された音声内にあれば自然な合成音声になるが、そうでない場合、接続部分などで自然性を損なうことがあるのが特徴。
    また、速度や声の高さを多少調整することはできるものの、それ以外の編集は原理的に難しい、比較的従来の音声合成手法。

~サンプル音声内容~

研修男性イメージ

【みなさん、こんにちは。本日のテーマは新入社員研修です。
この研修では、4つのポイントを解説していきます。】

DNN音声合成方式による男性の声

波形接続型音声合成方式による男性の声

DNN音声合成方式による女性の声

波形接続型音声合成方式による女性の声

コールセンター女性イメージ

【お電話ありがとうございます。こちらは、インフォメーションセンターです。
ご希望の番号をお選びください。案内の途中でも、番号操作は可能です。】

DNN音声合成方式による女性の声1

波形接続型音声合成方式による女性の声1

DNN音声合成方式による女性の声2

波形接続型音声合成方式による女性の声2

店員イメージ

【いらっしゃいませ。本日もご来店、誠にありがとうございます。
どうぞ、ごゆっくりお買い物をお楽しみ下さい。】

DNN音声合成方式による女性の声

波形接続型音声合成方式による女性の声

従来の波形接続型音声合成方式よりも、DNN音声合成方式による音声の方が感情表現が自然で、人により近づいている事がわかるかと思います。
さらに詳しく音声の質を体感したい方は、ぜひ一度公式HPのデモンストレーションをお試しください。

AITalk®の
実際の利用画面は?

ナレーション作成画面

声の職人操作画面1

任意の文章を人の声に近い自然な音声で合成し、音声ファイルとして保存します。画面下のイントネーション調整では、カーソルを動かすことで細かな強弱指定が可能です。

感情表現画面

声の職人操作画面2

AITalkでは「平静」「喜び」「怒り」「悲しみ」の感情を調整できます。※一部話者のみ可能

各種設定画面

声の職人操作画面3

音量、話速、高さ、抑揚などの調整ができる画面です。強弱はカーソルを上下に動かすことで指定できます。

単語登録画面

声の職人操作画面4

業界や分野特有の専門用語、略語、製品名など、よく使う言葉や固有名詞をあらかじめ登録しておくことができる機能です。

ナレーション修正画面

声の職人操作画面5

イントネーションや文章の読み方など、部分的にナレーションを修正できます。また、アクセント句ごとに音量、話速、高さ、抑揚を細かく指定することも可能です。

AITalkは声自体の品質向上もさることながら、初めての方でも利用していただけやすいよう操作画面の改良を重ねてます。 
さらに詳しい操作画面や使い方をチェックしたい方は、ぜひ一度公式HPをご覧ください。

AITalk®が活用されるシーン

AITalkは、大手企業や官公庁まで500社以上の導入実績を持っています。活用事例は、大きく分けるとこちらです。

  • 音声対話
  • 防災行政無線・全国瞬時警報システム
  • 道路・交通情報(カーナビ)
  • 観光案内・館内放送
  • スマートフォン
  • 電話自動応答システム
  • ロボット
  • WEBキャンペーン
  • ゲームのアテレコ・ナレーション
  • e-learning・教材・マニュアル作成
  • 電気機器への連携

明瞭で聞き取りやすい音声生成が可能なAITalkは、緊急性が高い防災行政無線や雑音が大きい観光地や商業施設の案内アナウンス、的確な指示が求められるカーナビの音声アナウンスなど、導入実績が豊富です。 
さらに詳しい導入の事例をチェックしたい方は、ぜひ一度公式HPをご覧ください。

株式会社エーアイとは

株式会社エーアイは音声合成の専門会社として、音声に関する疑問や悩みに対して、さまざまな角度から解決へ導きます。代表取締役社長吉田大介氏は、2022年2月に自らの寄付を基とした「音声合成研究奨励賞吉田賞」を設立するなど、音声合成ソフトにかける想いもひとしおです。
また、音声合成の開発からソリューションへの導入サポート、導入後のアフターケアまですべて自社で対応しています。お客様1人1人に最適な音声合成の提案・導入を心掛けている会社です。

会社概要

  • 所在地:東京都文京区西片1-15-15 KDX春日ビル10F
  • 設立年:2003年
  • 公式URL :https://www.ai-j.jp/company/
  • 電話番号:03-6801-8461