電話リレーサービスと中途失聴・難聴者

「新ノーマライゼーション」2020年11月号

一般社団法人全日本難聴者・中途失聴者団体連合会 理事長
新谷友良(しんたにともよし)

1.はじめに

日本には1400万人を超える聴覚に障害をもつ人がいます(図1)。そのような人の大多数は、自らの声で話すことが可能と思われます。自分の声で相手側に話しかけ、相手側の音声が文字で表示される電話システムは、そのような人にとって大きな福音となります。

図1 人口に占める聴覚障害者の割合
図1 人口に占める聴覚障害者の割合拡大図・テキスト

また、電話音声を文字化する場合、オペレーターが電話音声を聞いて入力することが考えられますが、音声認識ソフトを活用し文字化する方法も考えられます。しかし音声認識ソフトは通信環境や相手の発音・滑舌に認識精度が大きく左右されます。そのような環境下での音声認識ソフトの電話利用の実用性を調査した事例は今までありませんでした。そこで「文字付き電話を実施する時、現時点の音声認識ソフトの活用がどれだけ現実的(実用的)なのかを分析・評価することを目的として実証実験を行う」という問題意識のもとに、私たち(一社)全日本難聴者・中途失聴者団体連合会(以下、全難聴)は、日本財団の助成を受けて2018、2019年の2年間にわたって「電話利用における音声認識ソフトの調査事業」を実施しました(参照https://www.zennancho.or.jp/3005/)。

2.電話リレーサービスの入力手段に音声の活用を図ること

昨年12月に公表された「デジタル活用共生社会実現会議 ICTアクセシビリティ確保部会 電話リレーサービスに係るワーキンググループ」の報告書「公共インフラとしての電話リレーサービスの実現に向けて」(以下、WG報告書)においては、代表的な電話リレーサービスとして、1.ビデオリレー、2.文字リレー、3.字幕表示機能付の電話機によるリレー、4.音声リレーの4つが紹介されており、WG報告書には1、2を中心に検討を行ったとあります。そして、WG報告書の7頁に記載されている課題に対する意見として「利用者の音声を相手先にそのまま伝え、相手先からの返答だけを利用者にテキストで伝える方式についても検討を進めるべきである。」の記載があります。

電話リレーサービスの利用者として想定されている聴覚障害者の多くは、日常的なコミュニケーション手段として補聴器・人工内耳を利用しています(図2)。聴覚障害者の日常生活において、音声(発語)がどの程度利用されているか公的な調査結果は見当たりませんが、少なくとも補聴器・人工内耳利用者は発語によって、「話せるが聞こえない状態」で日常生活を送っているものと理解されます。

図2 聴覚障害者の日常的なコミュニケーション手段
図2 聴覚障害者の日常的なコミュニケーション手段拡大図・テキスト

検討されている電話リレーサービスにおいては、受信者側(聞こえる人)の入力手段は、キーボード入力ではなく音声入力を想定されていながら、利用者側の入力はキーボード入力のみになっていますが(図3)、上記の聴覚障害者の日常生活におけるコミュニケーション手段を考えれば、利用者側の入力手段は、音声入力・キーボード入力・映像(手話)入力の選択が可能なシステムにすべきと考えます(表1)。

図3 利用システムのイメージ図
図3 利用システムのイメージ図拡大図・テキスト
「電話利用における音声認識ソフトの調査事業」(参照https://www.zennancho.or.jp/3005/)P6,7

表1 2019年9月 米国電話リレーサービス 種類別利用実績
表1 2019年9月 米国電話リレーサービス 種類別利用実績拡大図・テキスト

3.電話リレーサービスの音声/文字変換に音声認識の活用を図ること

WG報告書の7頁には、実現に向けた基本的方向として「字幕表示機能付の電話機によるリレーや音声リレーを排除するものではなく、今後、公共インフラとしての電話リレーサービスの具体的なサービス内容や機能を検討する際に、利用者のニーズや利用実態などを踏まえて、字幕表示機能付の電話機によるリレーや音声リレーなどについても検討することが適当である。」と記載されております。

上述のように、全難聴は2年間にわたり「電話利用における音声認識ソフトの調査事業」を実施しましたが、実証実験の結果は、「電話音声の文字化について高い利用ニーズが確認されたものの、音声認識ソフトの実用性については、各項目(意味、ニュアンス、テンポ)の評価は低く、オペレーターによる入力の優位性が確認された」というものでした。この要因として、音声認識を利用するにあたっての環境的制約からくる文字化アプリの未完成のもたらした部分が非常に大きく、iOSにとどまらずAndroidにおいてもAPI(Application Program Interface)利用の制限が大きな壁となっております。今回の実証実験が「調査環境を整えた音声認識率の数値比較(ラボ型)ではなく、社会的な実証実験としてモニターが普段の生活のなかで文字付き電話を使い、利用者としての実用性を評価する方法(フィールド型)」で進められたことを考えると、文字化アプリの操作性が実験結果に与えた影響は非常に大きかったと考えています。

電話リレーサービスにおける仲介者(手話・文字オペレーター)利用の有効性は確認されており、現在その事業モデルの課題は、事業運営上の課題(事業主体、オペレーター養成・配置・事業費用の負担方法など)に移りつつあります。WG報告書では、サービス提供の費用を中間値で34─43億円と想定、その費用の多くは仲介者に要する費用としています。また、同報告書では利用者の範囲を限定しないとしていますが、利用者は8万人/年(中間値)と予測されています。我が国の聞こえに困難を抱えている人は、前述のように1400万人以上いると考えられ、この人たちの多くは電話利用が困難な状況に置かれています。この人たちのどの程度が電話リレーサービスを利用するか見極めは困難ですが、仮にこのうちの10%の人が電話リレーサービスを利用するとすれば、サービス利用者は約140万人となり、サービス提供費用の大幅な増加も想定されます。

今回の実証実験で、音声認識利用の文字付き電話リレーに対する潜在的ニーズの確認はできましたが、音声認識利用の環境面からの制約で、フィールドでの実証実験は不十分に終わりました。その経験から、実証実験で浮かび上がった以下のような課題を広く検討することが今後の電話リレーサービスを考える上での焦眉の課題と考えています。

1.文字化アプリの完成度を向上するための、携帯端末OSと外部システムをつなぐ技術仕様「API(Application Program Interface)」の公開の実現

2.電話通信環境の音声認識精度に与える影響のさらなる評価

3.騒音など送受信者の利用環境が音声認識精度に与える影響の評価

4.文字付き電話利用者が文字表示に求める文字表示精度の研究

menu