医療業界

医療業界において、音声合成の技術や開発は次々と導入されています。このページでは、医療業界において、発声機能が失われつつある方に向けたサポートとして期待されている音声合成技術の現状や実際の医療現場で導入されている活用事例などを紹介します。

医療業界と音声合成の現状

現在、医療や福祉業界において音声合成の活用が進みつつあります。特に、筋萎縮性側索硬化症(ALS)などにより発声機能を失いつつある方や手術の後遺症などで声が出せない方の個人用音声合成システムの作成が現実的になりつつあります。

たとえば、声を失いつつある方の声をコンピュータに模倣させることで本人の声に近い音声出力を行ったり、喉頭摘出者や構音の方でも自然で聞き取りやすい音声へとリアルタイムで変換する技術など、実際に意思伝達装置として現場に取り入れられています。

音声合成の技術や研究は目覚ましいものであり、音声の障害を持つ方にとって単なる読み上げ機能装置ではなくアイデンティティ表現ツールであり、QOL向上に貢献するという研究成果も存在しています。そのため、現状として音声合成技術は医療・福祉分野で大いに期待されているといえるでしょう。

医療業界での導入事例

現在、医療業界では声を失いつつある方へ向けて意思伝達装置として現場に取り入れられています。その他にも人を介さず音声合成による説明を聞くことで、忙しい医療現場の時間節約などにも成功しているようです。

音声合成技術が医療業界で導入された事例をピックアップしました。

手術の説明スライド

秋田大学医学部附属病院では、手術前にAI Talk声の職人の音声で作成した20分間の説明スライドを患者さんに見せています。その間に医師は電子カルテや書類の用意といった事前準備を終わらせることができ、準備が完了したタイミングで患者からの質問応答と、音声合成によって業務の効率化を可能にしました。

一般的に手術をする場合、説明や回答時間に1時間、事前準備に20分程度必要です。しかし患者側への理解が進まない、また説明映像を作成したとしても技術の進歩により治療法が変更されれば、その都度映像を修正するには費用がかかるといった課題を抱えていました。

しかし、AI Talkはソフトの操作がわかりやすいことと、自然な音声で患者さんからも理解やすいと高評価を受けており、人を介さず分単位で行動する多忙な病院スタッフの業務負担の軽減や効率化に繋げることに成功しています。

参照元:株式会社エーアイ公式HP「お客様事例」(https://www.ai-j.jp/client/voice65/)

病気で声を失った人に向けて

株式会社アニモは、財団法人ニューメディア開発協会様の助成のもと、東京大学医学部附属病院耳鼻咽喉科、および株式会社富士通研究所と共同で個人音声合成サービスの技術開発を行い、自社の音声合成FineSpeechを使用した「個人音声辞書作成」作成に成功しました。

病気で声を失うかもしれない本人の音声を収録し、音声合成による「音声の辞書」(波形辞書)を作成し、それを基にテキストの読み上げに成功しています。

収録時間は約1時間であり、内容は挨拶文や短音節などです。収録させたい内容によって時間は異なります。また、収録は、病院の耳鼻咽喉科にある「聴覚検査室」のような防音性の高い場所で行うことができます。

参照元:株式会社アニモ公式HP「個人音声合成」(https://www.animo.co.jp/for_biz/ps)

失語症のサポート

医療や福祉分野では、雑談や問診などの自然会話から、患者の感情認識や精神状態などを捉えて異変を察知に特化した対話型AIシステム「HAL3」が活用されています。

「HAL3」を開発したクリスタルメソッド株式会社は、元々AIによる自動応答システムを手掛けていました。

「HAL3」では音声合成技術を活用することで、人とコミュニケーションを取ったり、失語症の人のサポートとして読み上げサービスを提供したりする際に、従来の機械音に比べ自然なイントネーションに成功しています。

参照元:AI Market公式HP「音声合成AIの活用事例・サービス」(https://ai-market.jp/howto/ai_voice_recognition_how/#AI_HAL3)

音声合成技術で医療業界の効率化が進む

医療業界において音声合成技術は、手術や病気の障害によって発話やコミュニケーションが困難な方との意思疎通ツールとして役立てることができます。

また、意思疎通ツールとしてのサポートだけでなく現場の効率化も進めていくので、音声合成技術は今後医療業界にとってさらに欠かせない技術になっていくでしょう。

本サイトでは医療業界でもニーズを満たす可能性がある「音声合成ソフト」のおすすめを紹介しています。目的に合うソフトがあるかもしれませんので、下記3選も参考にしてみてください。

目的に合ったものはどれ?
ニーズ別音声合成ソフトのおすすめ3選

音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。

調整が簡単で質の高い
音声合成をしたい

AITalk®
(株式会社エーアイ)
特徴
先端ディープラーニングを導入した独自の技術で、
音質・肉質感の向上、多様な発話表現を実現。
利用シーン
日本語・英語・中国語をメインに、
品質重視のカーナビや館内放送、ニュース読み上げなど

芸能人の声を使った
音声合成をしたい

コエステーション
(コエステ株式会社)
特徴
9万以上の一般ユーザーだけでなく、
40以上に
のぼる有名人などの
豊富な「コエ」の数。
利用シーン
世界観やPR要素重視の
ゲームやYouTube動画など
(エンタメ系)

外国語をメインに
音声合成をしたい

ReadSpeaker
(HOYA株式会社)
特徴
中国語と区別して広東語も。
日本語、英語(アメリカ・イギリス)、韓国語をはじめ、
24言語に対応。
利用シーン
観光案内や美術館の音声ガイダンスと
いった、
外国籍の方の利用が多い場所など

【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。