AITalk®(エーアイトーク)は、深層学習技術(ディープラーニング)を導入した音声合成ソフトです。ここでは、エーアイトークのおすすめポイントや導入例をまとめてみました。
エーアイが展開する新機種「AITalk5」は、昨今の先端技術である深層学習(ディープラーニング)を基にした、「DNN音声合成方式」という方式を採用しています。DNN音声合成とは、少ない労力でデータを処理できるニューラルネットワーク(脳内の神経回路を模した数学モデル)を用いた音声合成のことで、簡単に言うと、人間の脳に近づけたAI技術で音声合成ができるという事です。これにより、従来の音声ソフトよりなめらかな感情表現ができるようになったほか、日本語解析の強化により、漢字の読みやアクセントの間違いを出しにくくなりました。
エーアイトークでは、18名の日本語話者から目的に合った音声を選択できます。標準語と関西弁の2種類あり、性別年齢はもちろん、感情表現の有無や、従来の方式より滑らかさがアップしたナレーションである「DNN音声」の選択が可能です。
また、「AITalk international」では、英語や韓国語・中国語など、使用頻度の高い言語を中心に41の言語に対応しています。同じ英語でも、「アメリカ英語」「イギリス英語」「オーストラリア英語」など、地域によって異なるイントネーションも選択できます。
文字入力でナレーション作成ができる「AITalk 声の職人」やPowerPointの文章をそのまま音声化できる「AITalk 声プラス」、ライブラリで提供する「AITalk SDK」など、エーアイトークは複数の製品をシリーズ展開しています。PCでインストールするだけで簡単に始められるものから、既存の電子機器などに組み込んで利用するものなど、音を使用したい目的や現場に合った製品を揃えているため、活用できるシーンが幅広いのが魅力です。
成田国際空港株式会社からリリースされた音楽エージェントアプリ「成田コンシェルNariCo powered by しゃべってコンシェル」にエーアイトークが採用されています。アプリに直接話しかけるだけで、ユーザーの言葉の意図を読み取り、フライト情報や両替レートなど成田空港に関する情報がわかる、旅行や出張時に便利なアプリです。
年々増加している海外からのインバウンド観光客にもっと嵐山を楽しんでもらうためにとリリースした、ケータイ音声ガイダンス「おとたび」に、AITalk Internationalが導入されています。外国語のナレーション収録は、翻訳や各言語を話すナレーターの確保など、日本語収録以上に時間や手間が生じてしまうものですが、テキスト1つで簡単なナレーション制作のできるエーアイの音声合成が採用されました。
自由文音声とは、テキスト記入欄に入力した文章を音声化したものです。このため、テキスト入力できる文言であればどんなものでも音声化が可能です。
単語登録とは、専門用語や難しい単語もしくは定型文を登録して、音声合成を作成しやすくすることです。
話速変換は、発声のスピードを変えることで、単語と単語や文節と文節の間に空白を作ったり、間を詰めたりできます。話速変換によって、より聞き手に伝わりやすい音声の生成が可能です。
感情表現は、喜怒哀楽を調整できる機能です。声の高低や抑揚、話すスピードなどいくつかの要素を組み合わせることでこれを実現しています。
イントネーション調整とは、単語や文章ごとにイントネーションの強弱を設定できることです。メーカーや製品ごとに強弱できる段階が異なる場合があります。
音高調整は、単語や文章ごとに声の高低を設定できます。メーカーや製品ごとに強弱できる段階が異なる場合があります。
AITalkは「DNN音声方式」を採用した音声合成ソフトで、自然な感情表現や誤読の少なさなど、音声品質の高さが魅力です。また、選択できる日本語話者が18名と多く、目的にぴったりな音声を見つけられます。「AITalk International」では41の外国の言語に対応しています。
AITalkは、株式会社エーアイが開発・販売しています。2003年に設立された音声合成に特化した会社で、音声合成のみならず音声全般の相談に対応できるのが特徴です。2007年にAITalkシリーズのライセンス提供を開始、2018年には東京証券取引所マザーズ市場に株式を上場しています。豊富な知識や、幅広い活用シーンを想定したソフト開発を強みとしているので、音声合成ソフトをご検討の方は一度ご相談してみると良いのではないでしょうか。
AITalk 声の職人は、テキストを入力するだけで手軽に高品質な音声が作れるナレーション作成ソフトです。PCソフトなので、直接インストールしただけですぐ使用できます。イントネーション・感情表現の調整、業界用語などの単語登録。話すスピードも変えられるのも魅力。
AITalk 声プラスは、PowerPointのスライドに音声をプラスできるアドインソフトです。PowerPointのノート部分に入力されたテキストを取り込めば、自動的に音声化されます。
AITalk SDKは、人間らしく自然な声色で音声合成できるソフトウェア開発キットです。肉声が再現できる「コーパスベース音声合成方式」とナレーションが滑らかになる「DNNパラメトリック音声合成」の2種類から選択できます。主に、「番号呼び出しシステム」「自動放送」などに活用。
AITalk Server は、電話の自動応答システムやWEBサービスの音声読み上げに活用されるソフトです。
AITalk micro は、Android・IOSに対応した組み込み用小型音声合成ソフトウェア開発キッドです。主に、スマホアプリや車のナビゲーション、IoT関連やロボットに活用されています。
AITalk internationalは、41の外国語から自由に外国語音声が作成できます。主に、e-ラーニングや観光地での音声ナレーションや館内アナウンスで活用。
AITalk CustomVoice は、芸能人や声優または自分の声を収録して、日本語音声合成用のオリジナル辞書を作成するサービスです。テキストを入力するだけで、人間が話しているかのような音声合成が作れます。主に、各媒体のプロモーションやVtuberのボイスとして活用可能です。
音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。
調整が簡単で質の高い
音声合成をしたい
芸能人の声を使った
音声合成をしたい
外国語をメインに
音声合成をしたい