音声合成ができる製品一覧

この記事では、音声合成ができる製品を14個ご紹介します。高品質なサウンドを推しているものから無料で合成できるものまで色々あるので、気になる人はチェックしてみてください。

AITalk®(エーアイ)

AITalkは、深層学習の先端技術を導入したDNN音声合成方式で開発された音声合成ソフトです。自然な感情表現を演出できるので、機械っぽさが低減されます。

FutureVoice Crayon(NTTテクノクロス)

FutureVoice Crayonは、NTTが長年蓄積してきた音声データを元に、独自のニューラル波形生成音声合成処理を駆使して高品質な音声を維持しています。

ReadSpeaker(HOYA)

ReadSpeakerは、20の国の言語に対応しているので、外国語の音声コンテンツが定期的に必要な人におすすめです。

コエステーション(コエステ)

コエステーションは、声優や芸能人など40以上の有名人の声を自由に音声合成できるのが特徴です。一般ユーザーの場合、9万以上の音声データが搭載されています。

美音工房® 奏®(日立産業制御ソリューションズ)

美音工房 奏は、大手電機メーカー「日立」の研究所が独自開発した「セレクティブ重畳型音声合成方式」によって、アナウンサーにより近い声色が生成できます。

音声合成 mimi® TTS(Fairy Devices)

音声合成 mimi TTS は、NICT(国立研究開発法人情報通信研究機構)が開発した音声合成エンジンを使用しています。また、10ヵ国以上の言語に対応。

VoiceOperator音声合成(NEC)

VoiceOperator音声合成は、NEC独自の自然言語処理技術により、日本語の読み上げに正確性が増しました、長文ナレーションの音声生成がやりやすいです。

SpeeCAN®(Arcadia)

SpeeCAN は、複数の音声ツールを1つにまとめた音声合成ソフトです。そのため、幅広い用途に対応できます。

CoeFont(株式会社CoeFont)

CoeFontは、音声合成では珍しい月額ポイント制で、獲得したポイント内なら何回でも作成できます。選べる声が3000種類以上あるので、目的に合った声が見つかりやすいです。

ボイスソムリエネオ(日立ソリューションズ・クリエイト)

ボイスソムリエネオは、肉声に近い滑らかな声色が生成できます。アクセントやイントネーションなど細かい調整も可能です。

Voice Track Maker(東芝デジタルソリューションズ)

Voice Track Makerは、韻律射影機能によって感情表現とは異なる演技表現ができるようになりました。また、お試しの無料プランがあります。

音読さん

音読さんは、会員登録なしでWEB上のテキスト入力で音楽合成が作成できます。有料・無料すべて商用利用OKです。

VOICEVOX

VOICEVOXは、無料の音楽合成ソフトウェアです。商用利用もOKなので、音声合成に強いこだわりがなければ十分満足できる仕上がりでしょう。

テクノスピーチ

テクノスピーチは、名古屋工業大学が中心に開発した音声合成ソフトで、新しい方式の統計的パラメトリック音声合成手法により自然で滑らかな音色を演出できます。

AquesTalk(株式会社アクエスト)

AquesTalkは株式会社アクエストで提供している音声合成ミドルウェアです。明瞭な音声合成が可能であり、小型・軽量である点が特徴です。

VOICEPEAK(株式会社AHS)

VOICEPEAKは、入力文字読み上げソフトです。商用利用可能で、6人のナレーターの声から好みの声を選択できます。

FineSpeech(株式会社アニモ)

FineSpeechは株式会社アニモが提供している音声合成システムです。聞き取りやすさにこだわり、幅広い用途に合わせてプログラムも充実しています。

AI suite(NTTレゾナント株式会社)

AI suiteはAIを用いて音声を認識し、対話による対応ができます。AIが正しく相手の声、表情などを認識・理解することにより、自然な受け答えが可能なサービスです。

ドキュメントトーカ Plus(クリエートシステム開発株式会社)

ドキュメントトーカ Plusは読み上げや音声の認識ができるソフトで、わかりやすい操作性が魅力です。豊富な声種が用意されており、好みに応じて選択できます。

音声合成SDK(株式会社日立ケーイーシステムズ)

音声合成SDKは、滑らかに、自然な形で音声を読み上げられるソフトです。調整機能も搭載されており、音声の速さ、高さ、抑揚、音量などを細かく変更できます。

棒読みちゃん

フリーウェア開発者みちあき氏によって製作された音声合成ソフト。8種類の声質を標準で搭載しているほか、拡張性の高い有料プラグイン「VoiceroidTalkPlus」に対応しています。

テキストーク

テキストークはWity有限会社により製作された音声合成ソフトです。シンプルでわかりやすいユーザーインターフェースが特徴で、パソコンの操作に不慣れな方でも扱いやすい仕様となっています。

Amazon Polly

Amazon Pollyは幅広い言語に対応している音声合成ソフト。ニューラルテキスト読み上げ(NTTS)ボイスに対応しており、より自然な音声で文章を読み上げることが可能です。

Ruby Talk (日立ソリューションズ・テクノロジー)

女性7名・男性3名・子ども2名の音声で自然な読み上げが行えるミドルウェアです。漢字かな交じり文の文章について、高品位かつ肉声感を保ったまま読み上げます。

LINE AiCall (LINE CLOVA)

LINE AiCallはAIアシスタント・LINE CLOVAが搭載されたボイスボットです。テキストチャットの不満や不便を解消し、コールセンターの負担を軽減します。

音読のプロ

音声のプロはテキストを入力またはコピーするだけで読み上げを行うソフトです。AITalk®エンジンを搭載し、男性と女性それぞれの声で自然に読み上げを行います。

WorldVoice 日中英韓2(高電社)

日本語・英語・中国語・韓国語に対応する音声合成ソフトで、再生ボタンを押すだけで利用でき手軽です。

COEIROINK

創作したオリジナルキャラクターに声を与えるための音声合成ソフトです。営利・非営利を問わず無償で利用できます。

Narakeet

Narakeetはブラウザにてテキストを入力するだけで音声合成が可能なソフトで、PowerPointファイルの音声付与も可能です。

ToSpeak(東芝デジタルソリューションズ)

ToSpeakは日本語以外の多言語にも対応した音声合成ミドルウェアです。パソコンやアプリケーションなどの各種機器に音声を組み入れることができます。

A.I.VOICE GUMI(株式会社インターネット)

A.I.VOICE GUMIは実在する女性声優の声をベースにした音声作成ソフトです。従来の基本機能に新しい便利機能が加わり、さらに操作性が向上しています。

Dojo(株式会社テンダ)

Dojoは日本語も含めた世界16ヶ国26言語の音声合成が可能な自動マニュアル作成ソフトウェアです。一定品質のマニュアルが作成できる機能が充実しています。

Watson Text to Speech(IBM)

Watson Text to Speechは、テキストをさまざまな言語の音声に変換することができるAPIクラウド・サービスで、カスタマーサービスなどにかかる時間を大幅に削減することができます。

Inspirium 音声合成ライブラリ V3.0(富士通株式会社)

Inspirium 音声合成ライブラリ V3.0は、人の話し方に近いやわらかな読み上げが可能で、家庭用家電や専用端末、サービスロボットなどに搭載して人々を音声で案内する際に役立ちます。

目的に合ったものはどれ?
ニーズ別音声合成ソフトのおすすめ3選

音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。

調整が簡単で質の高い
音声合成をしたい

AITalk®
(株式会社エーアイ)
特徴
先端ディープラーニングを導入した独自の技術で、
音質・肉質感の向上、多様な発話表現を実現。
利用シーン
日本語・英語・中国語をメインに、
品質重視のカーナビや館内放送、ニュース読み上げなど

芸能人の声を使った
音声合成をしたい

コエステーション
(コエステ株式会社)
特徴
9万以上の一般ユーザーだけでなく、
40以上に
のぼる有名人などの
豊富な「コエ」の数。
利用シーン
世界観やPR要素重視の
ゲームやYouTube動画など
(エンタメ系)

外国語をメインに
音声合成をしたい

ReadSpeaker
(HOYA株式会社)
特徴
中国語と区別して広東語も。
日本語、英語(アメリカ・イギリス)、韓国語をはじめ、
24言語に対応。
利用シーン
観光案内や美術館の音声ガイダンスと
いった、
外国籍の方の利用が多い場所など

【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。