音声合成SDK(株式会社日立ケーイーシステムズ)

株式会社日立ケーイーシステムズが開発している音声合成SDKとは、どのようなソフトなのかについて解説します。利用できる機能や特徴などについてまとめました。

音声合成SDKとは

自然な音声で聞き取りやすい

音声合成SDKは、漢字かな混じりのテキストデータを音声に変換できるシステムです。いかにも合成された音声ではなく、非常に滑らかで肉厚感が高いのが特徴です。 自然な抑揚もついているので、実際に人が話しているのと似たような感覚で発声できる音声合成ソフトを求めている方は、ぜひサンプル音声を聞いてみてはいかがでしょうか。 株式会社日立製作所の中央研究所によって開発された高品位知的音声合成技術が採用されています。

同表記異読文字の読み分け機能が優れている

発音は同じであるものの意味が異なる言葉に対し、読み分けが可能です。前後の文脈から判断して読み分けてくれます。そのため、細かい調整などをする必要がなく、使いやすさにおいて優れています。 合成した音声の速さ、高さ、抑揚、音量などは、再生している最中でも変更可能です。

ロボット風読み上げにも対応

エコー機能のほか、ロボット音声も選択できます。ロボット音声は棒読みのような形で読み上げるものではなく、音声を加工し、声に表情をつけた形でロボット風の読み上げができるのが特徴です。 基本的な音声の種別は女声:1種類、男声:1種類で、このうち1種類はSDKに付属していますが、2種類目についてはオプションの扱いとなります。

自動判定機能が便利

一つひとつ細かく調整をしなくても、適切なものを自動判定する機能が備わっています。 例えば、アルファベットの読みについては、基本辞書に登録されている英単語は登録した読みで、登録されていないものはローマ字読み、アルファベット読みの順で自動判定されるのが特徴です。 数字の読みについても同様で、自動判定が利用できます。24桁以下のものであり、先頭が0以外なら桁を付与して数字を読みます。25桁以上、先頭が0であれば棒読みです。

他にも桁読みなどの機能があり、それぞれどのような読み方にするかについては指定可能です。 基本辞書が無料で利用可能であるため、一般的な単語などについては登録しなくてもきちんと読み上げてくれます。この他にユーザー辞書が用意されており、表記、読み、品詞、アクセントなどを指定して登録可能です。

よく使う単語などについてはユーザー辞書をうまく活用することにより、更に理想に近い形での読み上げに繋がるでしょう。また、辞書に登録されていないものについても、言語解析処理機能が搭載されているため、正しく読めるものもあります。

音声合成SDKの導入事例

公式サイトに導入事例の記載はありませんでした。

音声合成SDKの機能

音声合成SDKのおすすめポイント

シンプルで操作性が高いのが特徴です。それでいて非常に滑らかな形で音声の合成が行えます。 使いやすく、機能性にも優れているものを選択したい方に向いているでしょう。 また、通常盤のほか、動作スペックが低い環境でも使いやすいように、コンパクト版のシステムも用意されています。スペックに合わせて適した方を選択できるのも魅力です。

ニーズ別!業務効率化におすすめな
音声合成ソフトを見る

音声合成SDKを制作している株式会社日立ケーイーシステムズとは

株式会社日立ケーイーシステムズは、株式会社日立産機システム、株式会社日立製作所を株主とする日立グループであり、ソリューション・サービス・テクノロジーを提供している会社です。 ソリューション事業のほかに、プロダクツサービス事業、組込・アウトソーシング事業などにも取り組んでいます。

扱っているソフト一覧

公式HPに記載がありませんでした

会社概要

目的に合ったものはどれ?
ニーズ別音声合成ソフトのおすすめ3選

音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。

調整が簡単で質の高い
音声合成をしたい

AITalk®
(株式会社エーアイ)
特徴
先端ディープラーニングを導入した独自の技術で、
音質・肉質感の向上、多様な発話表現を実現。
利用シーン
日本語・英語・中国語をメインに、
品質重視のカーナビや館内放送、ニュース読み上げなど

芸能人の声を使った
音声合成をしたい

コエステーション
(コエステ株式会社)
特徴
9万以上の一般ユーザーだけでなく、
40以上に
のぼる有名人などの
豊富な「コエ」の数。
利用シーン
世界観やPR要素重視の
ゲームやYouTube動画など
(エンタメ系)

外国語をメインに
音声合成をしたい

ReadSpeaker
(HOYA株式会社)
特徴
中国語と区別して広東語も。
日本語、英語(アメリカ・イギリス)、韓国語をはじめ、
24言語に対応。
利用シーン
観光案内や美術館の音声ガイダンスと
いった、
外国籍の方の利用が多い場所など

【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。