株式会社日立ケーイーシステムズが開発している音声合成SDKとは、どのようなソフトなのかについて解説します。利用できる機能や特徴などについてまとめました。
音声合成SDKは、漢字かな混じりのテキストデータを音声に変換できるシステムです。いかにも合成された音声ではなく、非常に滑らかで肉厚感が高いのが特徴です。 自然な抑揚もついているので、実際に人が話しているのと似たような感覚で発声できる音声合成ソフトを求めている方は、ぜひサンプル音声を聞いてみてはいかがでしょうか。 株式会社日立製作所の中央研究所によって開発された高品位知的音声合成技術が採用されています。
発音は同じであるものの意味が異なる言葉に対し、読み分けが可能です。前後の文脈から判断して読み分けてくれます。そのため、細かい調整などをする必要がなく、使いやすさにおいて優れています。 合成した音声の速さ、高さ、抑揚、音量などは、再生している最中でも変更可能です。
エコー機能のほか、ロボット音声も選択できます。ロボット音声は棒読みのような形で読み上げるものではなく、音声を加工し、声に表情をつけた形でロボット風の読み上げができるのが特徴です。 基本的な音声の種別は女声:1種類、男声:1種類で、このうち1種類はSDKに付属していますが、2種類目についてはオプションの扱いとなります。
一つひとつ細かく調整をしなくても、適切なものを自動判定する機能が備わっています。 例えば、アルファベットの読みについては、基本辞書に登録されている英単語は登録した読みで、登録されていないものはローマ字読み、アルファベット読みの順で自動判定されるのが特徴です。 数字の読みについても同様で、自動判定が利用できます。24桁以下のものであり、先頭が0以外なら桁を付与して数字を読みます。25桁以上、先頭が0であれば棒読みです。
他にも桁読みなどの機能があり、それぞれどのような読み方にするかについては指定可能です。 基本辞書が無料で利用可能であるため、一般的な単語などについては登録しなくてもきちんと読み上げてくれます。この他にユーザー辞書が用意されており、表記、読み、品詞、アクセントなどを指定して登録可能です。
よく使う単語などについてはユーザー辞書をうまく活用することにより、更に理想に近い形での読み上げに繋がるでしょう。また、辞書に登録されていないものについても、言語解析処理機能が搭載されているため、正しく読めるものもあります。
公式サイトに導入事例の記載はありませんでした。
シンプルで操作性が高いのが特徴です。それでいて非常に滑らかな形で音声の合成が行えます。 使いやすく、機能性にも優れているものを選択したい方に向いているでしょう。 また、通常盤のほか、動作スペックが低い環境でも使いやすいように、コンパクト版のシステムも用意されています。スペックに合わせて適した方を選択できるのも魅力です。
株式会社日立ケーイーシステムズは、株式会社日立産機システム、株式会社日立製作所を株主とする日立グループであり、ソリューション・サービス・テクノロジーを提供している会社です。 ソリューション事業のほかに、プロダクツサービス事業、組込・アウトソーシング事業などにも取り組んでいます。
公式HPに記載がありませんでした
音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。
調整が簡単で質の高い
音声合成をしたい
芸能人の声を使った
音声合成をしたい
外国語をメインに
音声合成をしたい
【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。