ここでは、音声合成におけるイントネーションの調整について紹介しています。音声合成で人間が話すような自然な仕上がりにするためには、イントネーションの調整が欠かせません。音声合成ソフトでそれができるのでしょうか?以下で詳しく解説していますので、参考にしてください。
多くの音声合成ソフトでは、音声のイントネーションを調整できます。ソフトによって多少やり方は違いますが、音声をアレンジできる画面を開くと、読み上げたテキストの一音ごとにマークが付されているので、そのマークを上下に動かすことで調整が可能です。調整が終わるとイントネーションの位置が変更され、読み上げ時のイントネーションもそのとおりに変更されます。では、イントネーションを調整すると何が変わるのでしょうか?
音声合成ソフトによっては、「感情パラメータ」と呼ばれる調整機能があり、これを用いることで感情のある音声をつくることができます。方法としては、感情を調整する画面内で、感情値を調整するための左右にスライドできるバーがあるので、それを左右にドラッグさせることで感情を調整可能です。感情値は標準では0%になっていますが、100%まで増減できます。調整後の読み上げは感情のある音声に近づけられます。
参照元:VOICEPEAK(https://www.ah-soft.com/voice/manual/04_edit.html#4-8)
音声合成でイントネーションをつけるメリットは、音声合成ソフトの不自然さを軽減できることです。上手く調整することで、実際の人間がそのまま話しているような、リアルで違和感のない音声をつくることができます。
上述のとおり、音声合成ソフトのイントネーション調整で感情のある声をつくることは可能です。しかし現段階では、ソフトによって人間の感情を完璧に表現できるわけではないので、よりクオリティの高い感情表現が必要となる読み上げの場合は、音声合成ソフトより人に読んでもらう方法を検討したほうが良いでしょう。
音声収録において、コストや時間を抑えたい場合は、音声合成ソフトで対応するのが良いでしょう。実際のナレーターや声優を手配して録音するとなると、膨大な時間とコストがかかりますが、音声合成ソフトなら費用と時間をカットできます。
音声合成ソフトには無料版と有料版がありますが、高品質な音声合成をしたい場合は有料版がおすすめです。フリーソフトでもある程度のクオリティは確保できますが、有料版と比べて実現できる範囲が限られています。高品質を求めるなら有料版を検討したほうが良いでしょう。
音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。
調整が簡単で質の高い
音声合成をしたい
芸能人の声を使った
音声合成をしたい
外国語をメインに
音声合成をしたい
【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。