AITalk®
(株式会社エーアイ)

AITalk®(エーアイトーク)は、深層学習技術(ディープラーニング)を導入した音声合成ソフトです。ここでは、エーアイトークのおすすめポイントや導入例をまとめてみました。

AITalk®とは

独自技術が可能にした自然で滑らかな感情表現

エーアイが展開する新機種「AITalk5」は、昨今の先端技術である深層学習(ディープラーニング)を基にした、「DNN音声合成方式」という方式を採用しています。DNN音声合成とは、少ない労力でデータを処理できるニューラルネットワーク(脳内の神経回路を模した数学モデル)を用いた音声合成のことで、簡単に言うと、人間の脳に近づけたAI技術で音声合成ができるという事です。これにより、従来の音声ソフトよりなめらかな感情表現ができるようになったほか、日本語解析の強化により、漢字の読みやアクセントの間違いを出しにくくなりました。

海外言語を含む豊富な話者ラインナップ

エーアイトークでは、18名の日本語話者から目的に合った音声を選択できます。標準語と関西弁の2種類あり、性別年齢はもちろん、感情表現の有無や、従来の方式より滑らかさがアップしたナレーションである「DNN音声」の選択が可能です。
また、「AITalk international」では、英語や韓国語・中国語など、使用頻度の高い言語を中心に41の言語に対応しています。同じ英語でも、「アメリカ英語」「イギリス英語」「オーストラリア英語」など、地域によって異なるイントネーションも選択できます。

多種多様な製品展開で幅広いシーンに対応

文字入力でナレーション作成ができる「AITalk 声の職人」やPowerPointの文章をそのまま音声化できる「AITalk 声プラス」、ライブラリで提供する「AITalk SDK」など、エーアイトークは複数の製品をシリーズ展開しています。PCでインストールするだけで簡単に始められるものから、既存の電子機器などに組み込んで利用するものなど、音を使用したい目的や現場に合った製品を揃えているため、活用できるシーンが幅広いのが魅力です。

AITalk®の導入事例

成田空港音声エージェントアプリの応答音声のケース

成田国際空港株式会社からリリースされた音楽エージェントアプリ「成田コンシェルNariCo powered by しゃべってコンシェル」にエーアイトークが採用されています。アプリに直接話しかけるだけで、ユーザーの言葉の意図を読み取り、フライト情報や両替レートなど成田空港に関する情報がわかる、旅行や出張時に便利なアプリです。

参照元:エーアイ公式HP:https://www.ai-j.jp/topics/1814/

携帯・スマホを使った京都嵐山の観光ガイドの音声ガイダンスのケース

年々増加している海外からのインバウンド観光客にもっと嵐山を楽しんでもらうためにとリリースした、ケータイ音声ガイダンス「おとたび」に、AITalk Internationalが導入されています。外国語のナレーション収録は、翻訳や各言語を話すナレーターの確保など、日本語収録以上に時間や手間が生じてしまうものですが、テキスト1つで簡単なナレーション制作のできるエーアイの音声合成が採用されました。

参照元:エーアイ公式HP:https://www.ai-j.jp/topics/1852/

AITalk®の機能

AITalk®のおすすめポイント

AITalkは「DNN音声方式」を採用した音声合成ソフトで、自然な感情表現や誤読の少なさなど、音声品質の高さが魅力です。また、選択できる日本語話者が18名と多く、目的にぴったりな音声を見つけられます。「AITalk International」では41の外国の言語に対応しています。

ニーズ別!業務効率化におすすめな
音声合成ソフトを見る

エーアイを制作している株式会社エーアイとは

AITalkは、株式会社エーアイが開発・販売しています。2003年に設立された音声合成に特化した会社で、音声合成のみならず音声全般の相談に対応できるのが特徴です。2007年にAITalkシリーズのライセンス提供を開始、2018年には東京証券取引所マザーズ市場に株式を上場しています。豊富な知識や、幅広い活用シーンを想定したソフト開発を強みとしているので、音声合成ソフトをご検討の方は一度ご相談してみると良いのではないでしょうか。

扱っているソフト一覧

AITalk®声の職人

AITalk 声の職人は、テキストを入力するだけで手軽に高品質な音声が作れるナレーション作成ソフトです。PCソフトなので、直接インストールしただけですぐ使用できます。イントネーション・感情表現の調整、業界用語などの単語登録。話すスピードも変えられるのも魅力。

AITalk®声プラス

AITalk 声プラスは、PowerPointのスライドに音声をプラスできるアドインソフトです。PowerPointのノート部分に入力されたテキストを取り込めば、自動的に音声化されます。

AITalk®SDK

AITalk SDKは、人間らしく自然な声色で音声合成できるソフトウェア開発キットです。肉声が再現できる「コーパスベース音声合成方式」とナレーションが滑らかになる「DNNパラメトリック音声合成」の2種類から選択できます。主に、「番号呼び出しシステム」「自動放送」などに活用。

AITalk®Server

AITalk Server は、電話の自動応答システムやWEBサービスの音声読み上げに活用されるソフトです。

AITalk®micro

AITalk micro は、Android・IOSに対応した組み込み用小型音声合成ソフトウェア開発キッドです。主に、スマホアプリや車のナビゲーション、IoT関連やロボットに活用されています。

AITalk®international

AITalk internationalは、41の外国語から自由に外国語音声が作成できます。主に、e-ラーニングや観光地での音声ナレーションや館内アナウンスで活用。

AITalk®CustomVoice®

AITalk CustomVoice は、芸能人や声優または自分の声を収録して、日本語音声合成用のオリジナル辞書を作成するサービスです。テキストを入力するだけで、人間が話しているかのような音声合成が作れます。主に、各媒体のプロモーションやVtuberのボイスとして活用可能です。

会社概要

目的に合ったものはどれ?
ニーズ別音声合成ソフトのおすすめ3選

音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。

調整が簡単で質の高い
音声合成をしたい

AITalk®
(株式会社エーアイ)
特徴
先端ディープラーニングを導入した独自の技術で、
音質・肉質感の向上、多様な発話表現を実現。
利用シーン
日本語・英語・中国語をメインに、
品質重視のカーナビや館内放送、ニュース読み上げなど

芸能人の声を使った
音声合成をしたい

コエステーション
(コエステ株式会社)
特徴
9万以上の一般ユーザーだけでなく、
40以上に
のぼる有名人などの
豊富な「コエ」の数。
利用シーン
世界観やPR要素重視の
ゲームやYouTube動画など
(エンタメ系)

外国語をメインに
音声合成をしたい

ReadSpeaker
(HOYA株式会社)
特徴
中国語と区別して広東語も。
日本語、英語(アメリカ・イギリス)、韓国語をはじめ、
24言語に対応。
利用シーン
観光案内や美術館の音声ガイダンスと
いった、
外国籍の方の利用が多い場所など

【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。