実現・当事者目線の支援機器-自分らしい声で、伝わる会話を―発話が不明瞭な人のための明瞭音声合成ソフト「コノコエ」
「新ノーマライゼーション」2026年2月号
株式会社ヒューマンテクノシステム
渡辺聡・高野哲朗(わたなべさとし たかのてつろう)
1.はじめに
「伝えたいのに、伝わらない」
発話が不明瞭な人にとって、自分の声が相手にすぐに届かず、もどかしい思いをする場面は、日常生活や学校、職場など、さまざまな場面で生じます。ときには、何度も言い直したり、別の人に言い換えてもらったりすることもあります。
それでも、声は紛れもなくその人のアイデンティティを形づくるものです。自分の声で、自分の考えや気持ちを伝えられるかどうかは、日々の生活の質や人との関わり方に大きく影響します。声が不明瞭であることは、単に聞き取りにくいという問題にとどまらず、コミュニケーションの選択肢を狭めてしまうことにもつながります。
私たちは、こうした状況にある方のために、その人らしさ(話者性)を保ちながら、相手に伝わる聞き取りやすさ(明瞭性)を両立させることを目指し、明瞭音声合成ソフト「コノコエ」を開発しました。本稿では、製品開発のきっかけや特徴、そして実際にどのような場面での活用が期待されるのかを紹介します。
2.製品開発のきっかけ・経緯
これまで私たちは、病気で声を失う方に向けて、自分の声ソフト「ボイスター」を提供してきました。ALSなどの進行性の病気の初期や、咽頭がん・喉頭がんなどによる手術前のまだ声が出せる段階で本人の声を収録し、その音声を学習することで、入力した文章から本人の声を生成する音声合成ソフトです。これまで延べ200名を超える方に利用されています。
一方で、音声収録の時点ですでに発話が不明瞭な方もいます。脳血管障害などの突発的な病気や事故、脳性麻痺などの先天的な理由により、明瞭な発声が難しい場合です。ボイスターは収録した声を忠実に再現するため、収録音声が不明瞭な場合、生成される音声も同様に不明瞭になります。
ALSなどの病気が進行しボイスターを作成できなかった方や、「自分の声で、もう少し明瞭に伝えられたら」と語る脳性麻痺の方との対話を通じて、私たちはこの課題に向き合う必要性を強く認識しました。
こうした背景から、2020年に話者性と明瞭性の両立を目指した音声合成技術の開発に着手し、2023年の実証実験を経て、2024年に明瞭音声合成ソフト「コノコエ」として一般提供を開始しました。
3.苦労した点
話者性と明瞭性の両立は、言葉で表すほど単純なものではありませんでした。健常者のように明瞭でありながら、その人らしさを感じさせる声とは何か、またそれをどのように実現するのかについて、試行錯誤を重ねました。
そうした中で、写真を特定の画風に変換するAI技術が音声分野にも応用できるのではないかと考えました。健常者の明瞭な発声をその人らしい声質へと変換する手法を検討した結果、明瞭さを保ちながら話者性を反映した音声生成が可能になってきました。
現在の課題は、話者性と明瞭性のバランスです。明瞭性を高めるほど話者性が薄れ、話者性を優先すると聞き取りやすさが下がる場合があります。現在は複数の話者性と明瞭性のバランス案を提示し、実際に聞き比べてもらったうえで、利用者自身に選択してもらう方法をとっています。その際に得られたフィードバックを蓄積し、どのようなバランスがよりよいのかについて検討を進めています。
4.製品の特徴
コノコエは、話者性と明瞭性の両立を軸に設計された明瞭音声合成ソフトです。発話が不明瞭な方の声から、その人らしさを保ちながら、聞き取りやすい音声を生成します(図1)。
図1 話者性と明瞭性の両立を目指したコノコエの考え方
(拡大図・テキスト)
本章では、まずコノコエ固有の特徴を紹介し、その後に音声を「自分の声」として使い続けやすくするための設計上の特徴について述べます。
従来製品との違いの一つとして、音声の収録量が挙げられます。ボイスターでは約1,000文の収録が必要でしたが、コノコエでは100文未満の音声から音声合成器を作成できます。これにより、体力的な負担を抑えながら収録が可能となり、同時にコストの低減にもつながっています。
これらのコノコエ固有の特徴に加え、ボイスターでも採用してきた設計思想として、音声を「自分の声」として使い続けやすさを重視した点があります。
各種意思伝達装置との連携により、視線入力などを用いて入力した文章から音声を生成できます。また、インターネット接続を必要としないスタンドアロン型であるため、利用環境に左右されず継続して使用できます。音声データを利用者自身の端末内に保持できる点も、外部サービスに依存せず自分の声を管理できるという意味で重要です。
5.対象としている人と活用が期待される場面
コノコエは、発話が不明瞭なために自分の声では相手に十分伝わらないと感じている方を主な利用者として想定しています。会話明瞭度でいえば、「話題を知っていればどうにかわかる」レベルから「ほとんど聞き取れない」レベルの方が対象です。
背景となる理由はさまざまで、進行性の病気や突発的な病気・事故、脳性麻痺などの先天的な理由のほか、聴覚障害に起因する二次的な発話障害や、高齢に伴う発話の不明瞭さにも対応可能です。
家庭内での家族やヘルパーとの会話をはじめ、学校や職場でのやり取りなど、幅広い場面での活用が期待されます。これまで特定の人にしか伝わらなかった場合でも、より多くの人との会話が可能になります。
また、あらかじめ文章を用意して再生することで、会社での会議での発言や講演会でのプレゼンテーション、親しい人への朗読など、これまで難しかった場面でも、自分の声で思いを伝えることができます。
6.ユーザーの声
養護学校に通う高校3年生の男子生徒が、コノコエを用いて卒業式のスピーチを行いました。日常の会話では、発話が不明瞭なために初対面の人や多くの人が集まる場では思いを十分に伝えることが難しい状況でしたが、コノコエを使うことで、卒業式という改まった場においても、自分の考えを自分の声で伝えることが可能になりました。
スピーチは、意思伝達装置から原稿読み上げ機能を通して1文ずつ読み上げる形で、先生との練習(図2)を重ねた上で本番に臨みました。当日は多くの来賓が列席する中、自分の声で学校生活の思い出を明瞭に伝えることができ、本人やご家族、学校関係者からも好評でした。
※掲載者注:写真の著作権等の関係で図2はウェブには掲載しておりません。
7.今後の展開
コノコエは現在、期間限定で無料トライアルを実施しています。利用者一人ひとりのニーズを把握し、話者性と明瞭性のバランス調整などに反映していきます。
今後は、医療・リハビリ・介護の現場で音声収録が行える体制を整え、より多くの方が適切なタイミングで声を残せる環境づくりを進めます。
さらに、不明瞭な発話に対応した音声認識技術と組み合わせることで、入力負担を軽減し、より自然で快適な会話体験の実現を目指します。