ToSpeak(東芝デジタルソリューションズ)

ToSpeak(東芝デジタルソリューションズ)とは

ToSpeakは、TOSHIBAが提供している音声合成ミドルウェアです。テキストから人間の声のような音声を生成することができます。ここではToSpeakの特徴や導入事例、機能などを詳しく紹介します。

自社の商品に発話機能が付加できる

ToSpeakは、TOSHIBAが開発した音声合成ミドルウェアです。コンテンツ内部のテキストをToSpeakに伝えることで、音声として出力することができます。ゲームや自動車などの機器、サーバ側のソフトウェアやアプリケーションソフトなどに組み入れることもでき、自社の商品に「発話をする機能」を付加できる点が魅力です。

スタンドアロンで滑らかに発話する

ToSpeakの特徴は、極めて自然な音質の声でナレーション音声を生成できます。合成音声特有の「こま切れ感」を抑えており、滑らかな発声が特徴的です。クラウドに繋ぐ必要はなく、機器側のみで任意のテキストから音声へ変換可能。スタンドアロンな状態で稼働を行います。

ToSpeak(東芝デジタルソリューションズ)の導入事例

AI通訳機「ポケトーク®」のケース

ポケトーク株式会社が開発・提供する「AI通訳機「ポケトーク®」に、ToSpeak Gx NEOが使用されています。他言語から日本語に変換した際に、滑らかな発声でコミュニケーションを促します。

参照元:ToSpeak(東芝デジタルソリューションズ)公式HP:https://www.toshiba-sol.co.jp/case/case2019/sourcenext.htm

BOOK☆WALKERアプリのケース

KADOKAWAグループのデジタル戦略子会社として設立された電子書籍ストア「BOOK☆WALKER」が、キャラクターと会話を楽しめるアプリケーションの内部にToSpeak Gx Neoを導入した事例です。抑揚をつけて音声を調整するカスタマイズも加え、自然な発話が再現できました。

参照元:ToSpeak(東芝デジタルソリューションズ)公式HP:https://www.toshiba-sol.co.jp/case/case2019/bookwalker.htm?_gl=1*pt9s2q*_ga*MTQ4NjM5MzA5LjE2Nzc3MjU4MDM.*_ga_F231KPEZQJ*MTY3NzcyNTgwMi4xLjEuMTY3NzcyNTg0Ni4wLjAuMA..&_ga=2.190164771.966679421.1677725803-148639309.1677725803

シャープ株式会社のケース

シャープの冷蔵庫には、利用者と会話できる機能が搭載されているものがあります。この一部機種に、RECAIUS 音声認識ミドルウェア ボイストリガーを採用。冷蔵庫本体に組み込むと、クラウドの音声認識機能と比較して応答時間の短縮が可能です。利用者の呼びかけに素早く応答でき、スムーズに会話を始めることができる点が評価されました。

冷蔵庫本体に組み込むボイストリガーとクラウドの音声認識を併用し、冷蔵庫側からの音声認識による応答時間の短縮とクラウド側からの音声認識による応答内容の充実、両方を実現することに成功しました。

参照元:ToSpeak(東芝デジタルソリューションズ)公式HP:https://www.global.toshiba/jp/products-solutions/ai-iot/recaius/case/case-mw2312.html

アールエヌティーホテルズ株式会社のケース

全国に数多く展開中のリッチモンドホテルを運営しているアールエヌティーホテルズ。リッチモンドホテルのお問い合わせ窓口で、RECAIUS コンタクトセンタープラスを導入することになりました。

利用中のコンタクトセンターシステム「Amazon Connect」と連携することで、会話をリアルタイムに音声認識してテキスト化。オペレーターの応答業務を支援します。リアルタイム音声認識に連動したFAQの自動検索やレコメンド機能の活用によって、オペレーターが問い合わせ内容に合わせたFAQを参照しながら対応できるようになりました。

参照元:ToSpeak(東芝デジタルソリューションズ)公式HP:https://www.global.toshiba/jp/products-solutions/ai-iot/recaius/case/case-cc2312.html

株式会社グレープシステムのケース

グレープシステムは、組み込み機器関連や印刷関連のソフトウェア製品の開発・販売・サポートを行う会社です。パートナー企業の韓国で組み込み基板開発を行うイロウムから相談を受け、RECAIUS音声認識ミドルウェア ボイストリガーをマンションの各戸内に設置されているホームオートメーションの音声認識基板として導入しました。

韓国のマンションではオームオートメーションの音声認識の誤認識の多さが課題でしたが、RECAIUS音声認識ミドルウェア ボイストリガーの導入によって認識精度9割以上を実現しています。

参照元:ToSpeak(東芝デジタルソリューションズ)公式HP:https://www.global.toshiba/jp/company/digitalsolution/case/articles/case2023/gsm.html

STREAMAX社のケース

中国のSTREAMAX社は、AI技術を活用した商用車向けのモバイル監視および関連ソリューションを提供する企業です。そんなSTREAMAXが提供する商用車向けドライブレコーダーに、ToSpeakが採用。ToSpeak(米語版)を導入したことで、今までブザー音で流していた管理センターからのドライバーへの指示や通知が、音声で流せるようになりました。

例えば、管理センターが「連続運転しているため、できるだけ早くサービスエリアで休んでください」とテキスト入力すれば、音声でドライバーに通知。円滑なコミュニケーションを実現します。

参照元:ToSpeak(東芝デジタルソリューションズ)公式HP:https://www.global.toshiba/jp/products-solutions/ai-iot/recaius/case/case-ts202212.html

パシフィックゴルフマネージメント株式会社(PGM)のケース

PGMは、ゴルフ場マネジメント会社です。運営するGRAND PGM千代田カントリークラブは質の高い顧客サービスを強みとしていますが、より一層のサービス向上のためスマートフォンを利用したコミュニケーションAI「RECAIUS フィールドボイスインカム」を導入。

これまでスタッフ同士の連絡手段に型無線機やトランシーバーを使用していましたが、情報の伝達が遅れるといった課題がありました。RECAIUS フィールドボイスインカムを採用することで、クリアな音声でやり取りできるようになりお客様満足度の向上につながっています。

参照元:ToSpeak(東芝デジタルソリューションズ)公式HP:https://www.global.toshiba/jp/company/digitalsolution/case/articles/case2022/pgm.html

田場医院のケース

兵庫県の田場医院は、クリニック、リハビリテーション、保育、発達児童支援などを備えたた総合医療施設「まんかい」を開設して地域の医療を支えている病院ですが、医師やスタッフ間の連絡手段が固定の内線電話か対面という課題がありました。過去に従来型の無線インカムを導入しましたが、音声トラブルが頻発して運用を断念。

課題解決のためRECAIUS フィールドボイスインカムを導入したところ、広範囲な場所における即時の情報共有が可能に。伝達事項が可視化できるようになったことで、スタッフがより効率的に動けるようにもなりました。

参照元:ToSpeak(東芝デジタルソリューションズ)公式HP:https://www.global.toshiba/jp/company/digitalsolution/case/articles/case2022/tbi.html

ToSpeak(東芝デジタルソリューションズ)の機能

ToSpeak(東芝デジタルソリューションズ)のおすすめポイント

ToSpeakは、機器側のローカル処理でテキストから音声を合成できるミドルウェアです。アプリや機器への組み込みが可能で、自社製品に音声を付加し、スタンドアロンで稼働させることができます。

ニーズ別!業務効率化におすすめな
音声合成ソフトを見る

ToSpeak(東芝デジタルソリューションズ)を制作している東芝デジタルソリューションズ株式会社とは

東芝デジタルソリューションズ株式会社は大手の総合電機メーカー・TOSHIBAの社内カンパニーであり、TOSHIBAが培ってきたIoT、AI、ICT技術を駆使してものづくりを行っています。

扱っているソフト一覧

ToSpeak G3

ミドルレンジ(ARM CA9クラス)に対応したモデルです。

ToSpeak Gx NEO

パソコンやスマートフォンなどのハイエンドに対応するモデルです。

会社概要

目的に合ったものはどれ?
ニーズ別音声合成ソフトのおすすめ3選

音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。

調整が簡単で質の高い
音声合成をしたい

AITalk®
(株式会社エーアイ)
特徴
先端ディープラーニングを導入した独自の技術で、
音質・肉質感の向上、多様な発話表現を実現。
利用シーン
日本語・英語・中国語をメインに、
品質重視のカーナビや館内放送、ニュース読み上げなど

芸能人の声を使った
音声合成をしたい

コエステーション
(コエステ株式会社)
特徴
9万以上の一般ユーザーだけでなく、
40以上に
のぼる有名人などの
豊富な「コエ」の数。
利用シーン
世界観やPR要素重視の
ゲームやYouTube動画など
(エンタメ系)

外国語をメインに
音声合成をしたい

ReadSpeaker
(HOYA株式会社)
特徴
中国語と区別して広東語も。
日本語、英語(アメリカ・イギリス)、韓国語をはじめ、
24言語に対応。
利用シーン
観光案内や美術館の音声ガイダンスと
いった、
外国籍の方の利用が多い場所など

【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。