ToSpeak(東芝デジタルソリューションズ)

ToSpeak(東芝デジタルソリューションズ)とは

ToSpeakは、TOSHIBAが提供している音声合成ミドルウェアです。テキストから人間の声のような音声を生成することができます。ここではToSpeakの特徴や導入事例、機能などを詳しく紹介します。

自社の商品に発話機能が付加できる

ToSpeakは、TOSHIBAが開発した音声合成ミドルウェアです。コンテンツ内部のテキストをToSpeakに伝えることで、音声として出力することができます。ゲームや自動車などの機器、サーバ側のソフトウェアやアプリケーションソフトなどに組み入れることもでき、自社の商品に「発話をする機能」を付加できる点が魅力です。

スタンドアロンで滑らかに発話する

ToSpeakの特徴は、極めて自然な音質の声でナレーション音声を生成できます。合成音声特有の「こま切れ感」を抑えており、滑らかな発声が特徴的です。クラウドに繋ぐ必要はなく、機器側のみで任意のテキストから音声へ変換可能。スタンドアロンな状態で稼働を行います。

ToSpeak(東芝デジタルソリューションズ)の導入事例

AI通訳機「ポケトーク®」のケース

ポケトーク株式会社が開発・提供する「AI通訳機「ポケトーク®」に、ToSpeak Gx NEOが使用されています。他言語から日本語に変換した際に、滑らかな発声でコミュニケーションを促します。

参照元:ToSpeak(東芝デジタルソリューションズ)公式HP:https://www.toshiba-sol.co.jp/case/case2019/sourcenext.htm

BOOK☆WALKERアプリのケース

KADOKAWAグループのデジタル戦略子会社として設立された電子書籍ストア「BOOK☆WALKER」が、キャラクターと会話を楽しめるアプリケーションの内部にToSpeak Gx Neoを導入した事例です。抑揚をつけて音声を調整するカスタマイズも加え、自然な発話が再現できました。

参照元:ToSpeak(東芝デジタルソリューションズ)公式HP:https://www.toshiba-sol.co.jp/case/case2019/bookwalker.htm?_gl=1*pt9s2q*_ga*MTQ4NjM5MzA5LjE2Nzc3MjU4MDM.*_ga_F231KPEZQJ*MTY3NzcyNTgwMi4xLjEuMTY3NzcyNTg0Ni4wLjAuMA..&_ga=2.190164771.966679421.1677725803-148639309.1677725803

ToSpeak(東芝デジタルソリューションズ)の機能

ToSpeak(東芝デジタルソリューションズ)のおすすめポイント

ToSpeakは、機器側のローカル処理でテキストから音声を合成できるミドルウェアです。アプリや機器への組み込みが可能で、自社製品に音声を付加し、スタンドアロンで稼働させることができます。

ニーズ別!業務効率化におすすめな
音声合成ソフトを見る

ToSpeak(東芝デジタルソリューションズ)を制作している東芝デジタルソリューションズ株式会社とは

東芝デジタルソリューションズ株式会社は大手の総合電機メーカー・TOSHIBAの社内カンパニーであり、TOSHIBAが培ってきたIoT、AI、ICT技術を駆使してものづくりを行っています。

扱っているソフト一覧

ToSpeak G3

ミドルレンジ(ARM CA9クラス)に対応したモデルです。

ToSpeak Gx NEO

パソコンやスマートフォンなどのハイエンドに対応するモデルです。

会社概要

目的に合ったものはどれ?
ニーズ別音声合成ソフトのおすすめ3選

音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。

調整が簡単で質の高い
音声合成をしたい

AITalk®
(株式会社エーアイ)
特徴
先端ディープラーニングを導入した独自の技術で、
音質・肉質感の向上、多様な発話表現を実現。
利用シーン
日本語・英語・中国語をメインに、
品質重視のカーナビや館内放送、ニュース読み上げなど

芸能人の声を使った
音声合成をしたい

コエステーション
(コエステ株式会社)
特徴
9万以上の一般ユーザーだけでなく、
40以上に
のぼる有名人などの
豊富な「コエ」の数。
利用シーン
世界観やPR要素重視の
ゲームやYouTube動画など
(エンタメ系)

外国語をメインに
音声合成をしたい

ReadSpeaker
(HOYA株式会社)
特徴
中国語と区別して広東語も。
日本語、英語(アメリカ・イギリス)、韓国語をはじめ、
24言語に対応。
利用シーン
観光案内や美術館の音声ガイダンスと
いった、
外国籍の方の利用が多い場所など

【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。