フリーの音声合成ソフトは各社から様々な製品が提供されています。
ここでは、フリーの音声合成ソフトを一覧形式で紹介していきますので、参考にしてください。
テキストークは、日本語の文書を音声読み上げするソフトです。文字通り、日本語の文書を音声合成してWAV形式/M3形式で保存ができます。読み上げる必要のない言葉を事前に登録できる「読み飛ばし辞書機能」や、音声合成システムが対応できない言葉を事前に登録しておき、収録時に別の言葉に変換できる「読み仮名辞書機能」を活用することで、スムーズな音声合成が可能になります。ユーザーインターフェスがシンプルでわかりやすいため、パソコンに慣れていない方でも操作性がしやすいです。
ソフトークは、シンプルなフリーのテキスト読み上げ音声合成ソフトです。漢字を含む文章を音声合成で読み上げ、WAV形式で保存することができます。録音に対応したテキストファイルであれば、すべて自動読み上げが可能です。MikoVoice・SAPI(唄詠・OpenJTalk・MicrosoftSpeechPlatform)に対応するほか、便利な機能として、英語の話者(Microsoft Sam)に日本語に聞こえるように英語を読み上げさせる「空耳機能」を搭載しています。
棒読みちゃんは、漢字を含む日本語文章を音声合成で読み上げるフリーソフトです。小型軽量の日本語音声合成エンジン「AquesTalk」で音声合成します。ドラック&ドロップしたテキストファイルの読み上げも可能です。搭載機能は、8種類の声質を切り替えられる「声質の切り替え機能」、単語の発音のしかたを指定できる「辞書機能」、ライブ配信者がチャットログを通じて声質・速度・音程・音量を指定できる「タグ機能」などラインナップが豊富です。
音声合成による無料のテキスト読み上げソフトです。入力したテキストに沿って音声合成を行い、Windows・Mac・Linuxで再生と出力ができます。特色的なのは、多彩な音声ライブラリ。「優しく可愛い声」「低めのクールな声」「爽やかな青年の声」など10種類以上の音声が収録されており、しかもイントネーション調整機能も搭載しているため多彩な表現が可能です。商用・非商用を問わず無料で使えます。
CoeFontは、Webブラウザ上で使用できるAI音声プラットフォームです。ブラウザのに読み上げたい言葉を入力するだけで、喜怒哀楽のこもったAI音声をつくることができます。Web上で操作できる参入障壁の低さ、無料でありながら商用利用もできる利便性が特徴です。音声ライブラリは5,000種類以上が収録されており、有料版ではすべての声を使用できますが、無料版では数種類の声しか使えません。
フリーの音声合成ソフトも基本機能+αを備えたものが多く提供されており、一定レベルのクオリティによる音声合成を行うことが可能です。しかし、さらにクオリティの高い音声をつくりたいと思う場合は、有料ソフトの導入をおすすめします。
有料ソフトには以下のメリットがあります。有料音声合成ソフトでは、用途に応じて幅広い声質を選択できます。たとえば、AHS「VOICEPEAK 商用可能6ナレーターセット」では男性3名・女性3名・子ども声を含む計7種類のナレーターが揃い、ナレーション用からキャラクターボイスまで対応可能です。
また、CoeFontの有料版では5,000種類以上のライブラリを利用でき、多言語や方言のバリエーションも豊富です。これにより、プロモーション動画やeラーニング教材、IVRなど、案件ごとに声色を即座に切り替えられ、制作効率と表現力を大幅に向上できます。
有料ソフトは感情パラメータの調整機能を備えており、「喜」「怒」「哀」「楽」などのプリセットをワンクリックで適用可能です。VOICEPEAKでは感情強度や抑揚の細かい設定が行え、スクリプト上のキーワードにアクセントを入れることで、ディレクターの意図を忠実に再現します。
CoeFontも同様に「感情込め読み上げ」機能を搭載しており、視聴者の共感を呼ぶナレーション制作を手早く実現します。
一部の無償TTSには歌声合成機能が試験提供されるものもありますが、本格的な歌声生成にはVOCALOIDやSynthesizer Vといった専用ソフトが適しています。例えば、VOICEVOXではプロトタイプ版として簡易的なメロディー合成を試せるものの、滑らかな歌唱やハモリ自動生成には対応していません。
歌声プロジェクトを内製化する際は、専用歌声合成ソフトを併用することで、外部スタジオへの依頼コストや納期調整の手間を大きく削減できます。
有料ソフトは購入時に商用・業務利用権が明示的に許諾されるため、非営利限定やクレジット表記義務といった制約がありません。AHS「VOICEPEAK 商用可能6ナレーターセット」では利用許諾契約書にて範囲が明確化され、安心して長期プロジェクトへ組み込めます。
サポート面ではオンラインヘルプやFAQ、お問い合わせフォームを通じた技術対応が中心で、バージョンアップやアップデート情報も定期配信されるため、運用中のトラブル対応もスムーズです。
以下の表は代表的な有料ソフト例(VOICEPEAK、CoeFont有料版)と無料ソフト例(VOICEVOX、OpenJTalkなど)を比較したものです。導入検討の参考にご活用ください。
| 項目 | 有料ソフト例 | 無料ソフト例 |
|---|---|---|
| 音質 | 24bit/96kHz対応(ノイズ低減処理あり) | 16bit/44.1kHz中心(ノイズ残存の可能性) |
| 音声ライブラリ数 | VOICEPEAK:7種 CoeFont:5,000種以上 |
VOICEVOX:10種前後 OpenJTalk:数種類 |
| 感情表現 | 喜怒哀楽+強度調整可 | 基本トーンのみ(手動ERB調整が必要) |
| 歌声対応 | 専用ソフト併用推奨 (VOCALOID、Synthesizer V) |
非対応または試験機能のみ |
| カスタム辞書 | GUI管理+一括編集機能 | テキスト編集中心(管理工数増) |
| 商用ライセンス | 包括許諾/再配布可 | 非営利限定/クレジット表記必須 |
| サポート | オンラインヘルプ・FAQ お問い合わせフォーム |
ユーザーフォーラム中心 |
| 導入コスト | 買い切り5万円~ サブスク月3,000円~ |
初期費用ゼロ |
有料の音声合成ソフトの公式サイトでは、サンプル再生できるものもあります。有料ソフトがどういうものか知りたい方は、まずはサンプルを聞いてみると良いでしょう。ぜひ気になる音声合成ソフトの公式サイトをチェックしてみてください。
音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。
調整が簡単で質の高い
音声合成をしたい
芸能人の声を使った
音声合成をしたい
外国語をメインに
音声合成をしたい
【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。