戻る / 目次 /  /  /  /  /  /  /  /  /  / 10 / 11 / 12 /  /  / 次へ


  2−1 音 訳(2次資料としての図書作り)
  2−1−1 視覚障害者用録音図書を作る
  2−1−2 配慮すること
  2−2 音声の知識
  2−2−1 音質の補正
  2−2−2 シンクロの単位としてのフレーズ
  2−3 XHTML(eXtensible HyperText Markup Language)
  2−3−1 図書の階層構造とHタグ
  2−3−2 リンク
  2−3−3 クラス属性とid(アイディー)
  2−4 イメージ画像の加工
  2−4−1 XHTMLファイルに貼りつける
  2−4−2 音声イベントにシンクロさせる


2 知っておきたい分野

 DAISY編集者がぜひ知っておきたい分野があります。視覚障害者用録音図書作りの技術の一つである「音声訳」、「波形編集」、「イメージ画像処理」、そして、DAISY編集です。

 2−1 音 訳(2次資料としての図書作り)

 Sigtuna3のトレーニングマニュアルに、音声訳について書かれているのが不思議に思われる方もあるかもしれません。音声訳(縮めて「音訳」)の練習法をお伝えするのではありません。視覚障害者への情報提供から出発した「初代デイジー」は、通常の読書が困難な人たちに2次資料としての図書を作り、これを提供する道具として歓迎されました。
 Sigtuna3を使ってマルチメディア版DAISYプロジェクトを制作するとしても、「図書を作る」ことを忘れるわけにはまいりません。図書作りをした経験のない方のために、その目的と留意点を整理します。

  2−1−1 視覚障害者用録音図書を作る

 視覚障害者は「情報障害者」とも言われています。中途で失明した人を例に説明しますと、障害によって視覚から得る情報が欠落してしまうため、今までと違い能力不全状態に陥ります。何らかの改善が得られなければ、社会的ハンディキャップとして「歩行の不自由」と「読書の不自由」を、その人は強いられることになります。
 この「読書の不自由」を少しでも緩和させようとする活動の技術の一つが「音訳」と言われているものです。この音訳技術で求められているものは、1次資料として示された情報は極力伝えよう。変換対象が文字ではあっても、音声でできるだけ伝えようと工夫されています。必要に応じて、漢字の説明や記号・符号の名称を伝えたりもします。逆に「読み物」といわれる作品群は、使われている符合などを読まない方法を選択したりもします。
 何よりも重んじているのは、誤読が無いこと。文字で書かれた1次資料を、的確に音声による2次資料にしているか、という点です。

  2−1−2 配慮すること

 文字の体系を音声の体系に変換するわけですから、無理が生じます。そこで、画一的ではなく、求めたユーザーがどう活用するかという点に焦点を絞って、文字から音声にする方法の指針を定めて音訳にかかります。
 音声での「配慮」を、このSigtuna3によるマルチメディア版DAISY図書の提供という段階になって、ユーザー層の増大、ニーズの多様性に伴って、今一度考えなおさねばなりません。大きな文字なら読める人、ぐんと拡大したカラー画像ならば視認が可能な人、やさしい文字表現ならば理解できる人、音声とイメージ画像の両方でならば理解しやすい人、さまざまな人が、Sigtuna3によって提供されるバリアフリーDAISY図書に期待を寄せることでしょう。
 プロジェクトを新規に開始する前に、ユーザーのニーズに対応するプラン、シナリオであるかどうか、もう一度、検討をする必要があります。

 2−2 音声の知識

 録音状態によっては、音声ファイルを一部音質補正する必要があります。日本の録音図書は、従来、家庭で録音されたものが多く、背景の音の混入を避けるため、マイクの位置を近めにして録音している場合が多いのです。また、カセットテープでの録音が大半を占め、回転ムラである「ワウ・フラッター」を音声データに大量に含んでいます。これが、キャリブレーション(無音部分の測定)での値を大きくしています。
 また別の面では、文字と音声の対応関係を誤解している人も多く見られます。音声学分野でのコンピューターによる音声解析の歴史は浅く、ほとんどの人が「かな文字」は音を表現したものだと考えています。
 「音声クリップ表示」や「編集画面」のツールである「音声エディタ」で見てみると理解できますが、最小単位と考えられた「子音+母音」(私たちはこれをカナで表記します)は、音声波形上では音節として区切られておらず、無声子音があって、はじめて波形のくびれとして見ることができます。「母音」は、通常の会話や音訳のスピードでは「ボイン」という3音節の音声ではなく、1波形として記録されています。
 このような文字と音声との関係も、波形編集アプリケーションで音質補正する必要があるとき、重要な知識となります。

  2−2−1 音質の補正

 前項では、音質補正をする必要がある場合について触れました。カセットテープからの「テープ転送」では、少なくともワウ・フラッターによる音の揺れを取り除き、「DCオフセット」のズレが生じているようならば、この補正だけはする必要があります。
 ワウ・フラッターは0〜数十Hzの低周波で、これにテープヒスノイズが重なっています。グラフィックイコライザー等を使って、この揺れを取り除きましょう。
 また、音声イベント編集中に気づいた「雑音」も、除去とまでいかないまでも軽減できるとよいでしょう。

  2−2−2 シンクロの単位としてのフレーズ

 Sigtuna3では音声編集の最小単位が「フレーズ」です。これが音声イベントとしてSMILファイルに記述されています。あまりにもテキストイベントと音声イベントの区切りがずれていると、「編集画面」での編集に手間取ります。
 例えば、「。」(句点)ごとにspanを使って区切ってあったとします。ところが、ノイズが多く、2〜3センテンスにわたって音声部分がイベントとして分かれていない場合、「音声クリップ表示」を使って音声イベントの分割をすることになります。
 当初予定した文字列に近くなるように、「録音設定」すると同時に、無音部分の検出が容易になるよう、ノイズを下げることが編集前のデータ取り込みのポイントとなります。

 2−3 XHTML(eXtensible HyperText Markup Language)

 「初代デイジー」からDAISY仕様2.02への一番の変化は、音声にテキストを持たせたところにあります。テキストを保有しているのがXHTMLファイルであり、シンクロを受け持っているのがSMILファイルです。ともに、インターネットの公表された標準技術です。

  2−3−1 図書の階層構造とhタグ

 図書には、大見出しの中に多数の中見出しがあり、その1つの中見出しの中には多数の小見出しがあります。図書のもつ論理構造をXHTMLファイルでは、h1、h2、h3という文字の表示サイズを使ってあらわします。h1は1のレベル、h2は2のレベルという具合に、h6のレベルまであります。

  2−3−2 リンク

 NCC(ナビゲーションコントロールセンター)ファイルには多数のリンクが書かれています。Lp Player日本語版で、ある見出しを選択するとすぐさまその個所にとび、該当する音声がすぐさま再生されるのは、このリンクによるものです。また、目次を聞いていて、目的の見出しのページ番号を聞き取って、数字キーで番号を入力して、すぐさまその個所から聞けるのもリンクのおかげです。
 NCCファイルの役割は「ナビゲーションコントロールセンター」といわれているように、このファイルを使って録音・編集、再生する役割を担っています。専用CDプレーヤーが図書を再生するにはNCCファイルをアクセスする必要があります。ところが、プロジェクトがフォルダに入れて整理してありますから、フォルダのままでは再生ができません。「discinfo.html」というファイルは、プレーヤーがフォルダの中に入ってncc.htmlファイルを読めるよう、リンクが書いてあるファイルです。

  2−3−3 クラス属性とid(アイディー)

 XHTMLファイルはタグを使って書かれています。
 以下は、スタイルシートでのクラスとIDの働きを使って説明します。
 タグを使っただけでも文字やイメージ画像を中央にそろえたり、右詰にしたりできますが、CSS(カスケーディングスタイルシート)を使うと容易に細部にわたるレイアウトが可能になり編集もしやすくなります。W3C(World Wide Web コンソーシアム)ではこのスタイルシートをもっと発展させた形として、XMLの制定をしています。
 このスタイルシートで対応させる単位として、タグ・クラス(class)・idがあります。スタイルシートでpタグに項目のいくつかを指定すると、XHTMLファイル内のすべてのpタグにその効果が適用されます。クラス(これは任意でいくつでも定義できます)を指定すると、そのクラスが指定されている個所に、効果が適用されます。
 idはそのXHTMLファイル内に1度しか使えませんが、その個所だけに効果が及ぶようになります。XHTMLファイルのテキストと音声ファイルを対応させるために、この一度だけしか使えないidが使用されています。

 2−4 イメージ画像の加工

 イメージ画像を加工するアプリケーションにはさまざまなものがあります。近年はデジタルカメラやスキャナーに付属したソフトもあり、使い慣れたアプリケーションを使って目的の画像を加工するとよいでしょう。

  2−4−1 XHTMLファイルに貼りつける

 テキストからXHTMLファイルを作成し、これにimgタグを使ってXHTMLファイルに貼り付けます。
 この場合の条件としては、プレイバックソフトがブラウズ画面に読み込むときに時間のかからないファイル容量にすること、将来ゲーム機でも再生されることを考慮して、ブラウズ画面に十分入るサイズにすることなどです。
 テキストの持つ文意から、再生する人が十分に理解するようにトリミングすることも必要なことでしょう。場合によっては、1つの元イメージ画像を2分割する必要が生ずるかもしれません。

  2−4−2 音声イベントにシンクロさせる

 Sigtuna3では、音声イベント群に1つのイメージ画像をシンクロさせることができます。ただし、この機能は一部のプレイバックソフト(LpPlayer)によってのみ実現される機能で、他のプレイバックソフトで保証されるものではありません。
 シンクロは「編集画面」で行います。
 イメージ画像加工の条件は、あまりファイル容量を大きくしないことです。10kB〜20kBに抑える必要があります。イメージの画質を重視するあまり、大きなファイル容量にすると、再生時に「音詰まり」を生じてしまうかもしれません。ユーザーによってパソコンの仕様がさまざまであることに留意してください。
 また、トリミングでは正方形の画像切り取りをするとよいでしょう。Lp Playerのポップ表示枠はデフォルトが正方形です。


戻る / 目次 /  /  /  /  /  /  /  /  /  / 10 / 11 / 12 /  /  / 次へ