Inspirium 音声合成ライブラリ V3.0(富士通株式会社)

Inspirium 音声合成ライブラリ V3.0(富士通株式会社)とは

Inspirium 音声合成ライブラリ V3.0は、富士通株式会社が提供している音声合成ライブラリです。やわらかで自然な合成音声をいろいろな機器で読み上げることができ、家庭や企業、施設などで活躍しています。ここでは、Inspirium 音声合成ライブラリ V3.0の特徴や機能などについて詳しく紹介します。

人のしゃべり方に近い自然な読み上げ

Inspirium 音声合成ライブラリ V3.0では、どうしても平坦になりがちな機械音声から進化し、人間のしゃべり方の特徴を活かした自然な合成音声での読み上げを可能にしています。

これは「最適化素片複合方式」と呼ばれる技術を応用したもので、合成時に音の接続位置が不連続とならないように考慮した音声を使用し、なめらかな音のつながりを作り出しています。さらに、通常よく使われる言い回しやフレーズについて人間のしゃべり方を分析し、その声の高さやイントネーション、リズム、ポーズなどの特徴である韻律データを活用して、人が語りかけるような自然な合成音声へと変換しているのです。 こういった技術の革新により、音声合成ソフトにありがちな人工的な印象ではなく、聞き取りやすく正確な音声読み上げで、使用する人が使いやすいよう案内をしてくれます。

充実した言語辞書による正確な読み上げ

任意のテキストを読み上げることのできるInspirium 音声合成ライブラリ V3.0ですが、約17万語の標準言語辞書に加え、ユーザーが追加できる言語辞書を同時に使用することができるので、より正確で聞き取りやすい読み上げをすることができます。 また、話す速さや声の高さ、アクセントなども設定できるので、使用する場所や場面に合った音声に調整することも可能で活用できる範囲が広がります。

さまざまな機器へ搭載可能

Inspirium 音声合成ライブラリ V3.0は、テレビやレコーダーなどの家電製品、カーナビゲーションシステムなどの車載機、スマートフォンやタブレット端末などの携帯端末、ATMやキオスクなどの専用端末、施設を案内するサービスロボットなど、さまざまな機器へ搭載することができます。

たとえば、テレビの番組表の読み上げやカーナビゲーションシステムの音声ガイダンス、スマートフォンでのメールやSNSの読み上げ、音声による操作の支援などに活用することで、日常生活に寄り添ったいろいろなサービスで利用することができるようになるでしょう。

Inspirium 音声合成ライブラリ V3.0(富士通株式会社)の導入事例

公式サイトに導入事例の記載はありませんでした。

Inspirium 音声合成ライブラリ V3.0(富士通株式会社)の機能

Inspirium 音声合成ライブラリ V3.0(富士通株式会社)のおすすめポイント

日本の企業である富士通株式会社によって制作されたInspirium 音声合成ライブラリ V3.0は、日本語の特徴である漢字かな混じりの文章から合成音声を生成する機能が高く、機械音声にありがちな人工的な印象のない、人の話し声に近いやわらかな音声での読み上げを可能にしています。

ユーザー言語辞書を追加することもできるので、標準言語辞書にはないような専門的な単語も自然に読ませることができるほか、独自の読み方を登録することもできるので、どんな場面にも対応できる合成音声が可能になっています。

ニーズ別!業務効率化におすすめな
音声合成ソフトを見る

Inspirium 音声合成ライブラリ V3.0を制作している富士通株式会社とは

Inspirium 音声合成ライブラリ V3.0を制作している富士通株式会社は、1935年に日本で創立され、総合エレクトロニクスメーカーとして情報処理システムや電子デバイスの製造・販売事業を行っています。

扱っているソフト一覧

公式HPに記載がありませんでした。

会社概要

目的に合ったものはどれ?
ニーズ別音声合成ソフトのおすすめ3選

音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。

調整が簡単で質の高い
音声合成をしたい

AITalk®
(株式会社エーアイ)
特徴
先端ディープラーニングを導入した独自の技術で、
音質・肉質感の向上、多様な発話表現を実現。
利用シーン
日本語・英語・中国語をメインに、
品質重視のカーナビや館内放送、ニュース読み上げなど

芸能人の声を使った
音声合成をしたい

コエステーション
(コエステ株式会社)
特徴
9万以上の一般ユーザーだけでなく、
40以上に
のぼる有名人などの
豊富な「コエ」の数。
利用シーン
世界観やPR要素重視の
ゲームやYouTube動画など
(エンタメ系)

外国語をメインに
音声合成をしたい

ReadSpeaker
(HOYA株式会社)
特徴
中国語と区別して広東語も。
日本語、英語(アメリカ・イギリス)、韓国語をはじめ、
24言語に対応。
利用シーン
観光案内や美術館の音声ガイダンスと
いった、
外国籍の方の利用が多い場所など

【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。