音声ブラウザご使用の方向け: ナビメニューを飛ばして本文へ ナビメニューへ

ハイテクばんざい!

リアルタイム・ニュース字幕制作システムについて

    中村章

概要

 昨年12月、聴覚障害の方々のために、3月27日の番組改訂にあわせて、リアルタイム字幕放送を「ニュース7」で試行することが決まった。
 これまで字幕放送は、朝の連続テレビ小説など生放送以外の番組で実績があったが、生放送では初めての試みである。
 本システムの特徴は、NHK放送技術研究所で研究・開発を進めてきた音声認識技術と、報道情報システム(事前入力原稿)を併用するハイブリッドシステムであり、リアルタイムのニュースに字幕サービスを可能とする初めてのシステムである。

1 はじめに

 聴覚に障害をもつ視聴者や、加齢により難聴になった視聴者は約六百数十万人いると推定されている。難聴者への放送サービスとして、字幕放送は欠くことのできない放送サービスの一つである。これまで、朝の連続テレビ小説や、一部のNHKスペシャルなどの事前収録番組で放送を進めてきたが、これらに加え、リアルタイムのニュースでも字幕放送などを通して情報を得たいとの要望が強く、早期の実用化が求められていた。放送までに時間的な余裕のある事前収録番組では、既存の設備で字幕を付加することができるが、生放送のニュースのような場合、リアルタイムで字幕を付加することは非常に難しい。
 今回、音声認識技術も併用しながら、リアルタイムのニュースに字幕サービスを可能とするシステムを開発した。

2 システムの特徴

 今回のシステムは、アナウンスコメントを自動的にテキスト化するため、
1.放送技術研究所で研究開発を進めてきた音声認識技術 
2.字幕表示の遅れが許されない場合などを想定し、事前に用意できるニュース原稿を「字幕スーパー用原稿」としてあらかじめ入力しておく事前原稿系
の二重化となっている。

3 システムの構成

 図1にシステムの構成図を示す。

図1 ニュース字幕制作システムの構成

図 ニュース字幕制作システムの構成

1 音声認識系

 放送技術研究所で研究開発を進めているアナウンサーの音声を自動認識し、テキスト化する技術を用いている。
1.ニュースセンターからアナウンスコメントが男性アナウンサー、女性アナウンサー別に音声認識サーバーに入力される。
2.自動的に音声認識サーバーでアナウンスコメントのテキスト化を行う。
3.修正端末にて、音声認識の誤りを素早く発見し、修正作業を行う。リアルタイム性を要求されるため、2クルー(A/B系)の修正オペレーターが短時間ごとに切り替えて作業を行っている。
4.言語モデル更新WS(ワークステーション)は、認識誤りの起こりやすい固有名詞や単語などを、事前に汎用原稿から入手し、音声認識辞書に登録して認識率を高めている。

2 事前原稿系

 報道情報システムを字幕原稿を入力できるように改修した。図2に報道情報端末の字幕原稿作成画面イメージを示す。
1.事前にアナウンス原稿を、報道情報端末で入力する。
2.入力方法は、直接アナウンス原稿を入力することに加え、汎用原稿からカット・アンド・ペーストで大まかな入力を行い、微調整を行うことも可能である。これらの字幕原稿は、字幕サーバーに格納される。

図2 報道情報端末の字幕原稿作成画面イメージ

図 報道情報端末の字幕原稿作成画面イメージ

3 原稿選択端末

 図3に原稿選択端末の画面イメージを示す。
1.ニュースオーダー情報を「GTV送出ホスト」から入手し、表示する。
2.事前原稿が入力し終わった項目は、ニュースオーダーに沿って、「音」(音声認識)か「原稿」(事前原稿)を入力しておく。音声認識系と事前原稿系との選択は、事前に総合デスク(字幕編責)の判断で、ニュース項目別に決められる。
3.「リソース種別」の欄には、二ュースオーダーに沿って、「音」(音声認識)か「原稿」(事前原稿)を入力しておく。音声認識系と事前原稿系との選択は、事前に総合デスク(字幕編責)の判断で、ニュース項目別に決められる。
4.前述のようにして入力した事前原稿は「原稿選択端末」でニュース項目別に選択して、「リソース切替装置」へ転送する。
 原稿選択端末は事前に入力した字幕原稿の試写機能も有している。

図3 原稿選択画面の機能

図 原稿選択画面の機能

4 音声認識と事前原稿とのリソース切替

 オーダーシートに沿って、ニュース項目ごとに切替を行う。図4にリソース切替端末の画面イメージを示す。
1.タッチパネル上で音声認識系か事前原稿系のリソースをプリセットする。
2.音声認識系の場合、音声認識系から転送されてくるテキストを逐次、「字幕変換端末」へ送出する。事前原稿系の場合、「テイク」キーを押すことにより送出タイミングを合わせることができる。
3.緊急時の場合を想定し、リソースの「強制切替」や「送出中止」キーも備えている。
 音声認識系はアナウンスコメントを入力してから、テキスト化できるまで、タイムディレーがある。同期を取りながら、音声認識系と事前原稿系を切り替えて送出することは非常に難しいが、今回、本システムで切り替えを可能とした。

図4 リソース切替端末の機能

図 リソース切替端末の機能

5 字幕フォーマット変換端末・装置

 図5に、字幕フォーマット変換端末の画面イメージを示す。本端末の基本的な機能は、リソース切替端末から転送されてきたテキストを字幕フォーマット(15.5文字×2行)に変換し、文字変換装置で映像信号の21Hに文字多重信号として重畳する。
1.放送開始時にタッチパネル上で「放送開始」を押し、字幕放送開始パケットを送出する。
2.字幕テキストを自動送出することを基本としているが、事前原稿系の場合、手動モードで、アナウンスコメントに同期して送出することも可能である。
3.放送可能な文字は、JIS第1/2水準、及び報道情報システムに登録されている外字30文字(・小平の「・」など)である。
 本字幕変換端末、字幕変換装置は平成11年度の新技術開発で先行的に試作を進めてきたものであり、今回、この装置をベースに改修を行った。

図5 字幕フォーマット変換端末の機能

図 字幕フォーマット変換端末の機能

4 終わりに

 本計画確定から放送開始まで数か月と非常に短期間であったが、報道情報システム原稿系、新技術開発等で培ってきたノウハウや技研の音声認識技術をベースに、リアルタイムのニュースに字幕サービスを可能とするシステムを構築した。
 放送開始の翌日(3月28日正午まで)、視聴者から「難聴になって10年、ニュースは手話ニュースを1人で見ていました。今日、10年ぶりで家族と一緒にテレビを見ました。涙が出るほど嬉しかった」など約150通のFAXが寄せられた。今後、自動化も含め検討していく。
 ちなみに、平成12年2月現在、文字放送受信機が累計1580万台、文字放送アダプターが累計146万台普及している(EIAJ調べ)。

(なかむらあきら NHK技術局)