Inspirium 音声合成ライブラリ V3.0は、富士通株式会社が提供している音声合成ライブラリです。やわらかで自然な合成音声をいろいろな機器で読み上げることができ、家庭や企業、施設などで活躍しています。ここでは、Inspirium 音声合成ライブラリ V3.0の特徴や機能などについて詳しく紹介します。
Inspirium 音声合成ライブラリ V3.0では、どうしても平坦になりがちな機械音声から進化し、人間のしゃべり方の特徴を活かした自然な合成音声での読み上げを可能にしています。
これは「最適化素片複合方式」と呼ばれる技術を応用したもので、合成時に音の接続位置が不連続とならないように考慮した音声を使用し、なめらかな音のつながりを作り出しています。さらに、通常よく使われる言い回しやフレーズについて人間のしゃべり方を分析し、その声の高さやイントネーション、リズム、ポーズなどの特徴である韻律データを活用して、人が語りかけるような自然な合成音声へと変換しているのです。 こういった技術の革新により、音声合成ソフトにありがちな人工的な印象ではなく、聞き取りやすく正確な音声読み上げで、使用する人が使いやすいよう案内をしてくれます。
任意のテキストを読み上げることのできるInspirium 音声合成ライブラリ V3.0ですが、約17万語の標準言語辞書に加え、ユーザーが追加できる言語辞書を同時に使用することができるので、より正確で聞き取りやすい読み上げをすることができます。 また、話す速さや声の高さ、アクセントなども設定できるので、使用する場所や場面に合った音声に調整することも可能で活用できる範囲が広がります。
Inspirium 音声合成ライブラリ V3.0は、テレビやレコーダーなどの家電製品、カーナビゲーションシステムなどの車載機、スマートフォンやタブレット端末などの携帯端末、ATMやキオスクなどの専用端末、施設を案内するサービスロボットなど、さまざまな機器へ搭載することができます。
たとえば、テレビの番組表の読み上げやカーナビゲーションシステムの音声ガイダンス、スマートフォンでのメールやSNSの読み上げ、音声による操作の支援などに活用することで、日常生活に寄り添ったいろいろなサービスで利用することができるようになるでしょう。
公式サイトに導入事例の記載はありませんでした。
日本の企業である富士通株式会社によって制作されたInspirium 音声合成ライブラリ V3.0は、日本語の特徴である漢字かな混じりの文章から合成音声を生成する機能が高く、機械音声にありがちな人工的な印象のない、人の話し声に近いやわらかな音声での読み上げを可能にしています。
ユーザー言語辞書を追加することもできるので、標準言語辞書にはないような専門的な単語も自然に読ませることができるほか、独自の読み方を登録することもできるので、どんな場面にも対応できる合成音声が可能になっています。
Inspirium 音声合成ライブラリ V3.0を制作している富士通株式会社は、1935年に日本で創立され、総合エレクトロニクスメーカーとして情報処理システムや電子デバイスの製造・販売事業を行っています。
公式HPに記載がありませんでした。
音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。
調整が簡単で質の高い
音声合成をしたい
芸能人の声を使った
音声合成をしたい
外国語をメインに
音声合成をしたい