戻る / 目次 / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 演 / 付
付−1 プロジェクトのファイル構成
付−2 DAISY Spec. 2.02について
付−3 CD-Rへの書き込み、discinfo.htmlの編集
付−4 Sigtuna DAR 3 JP日本語版用語解説
アルファベット配列
かな五十音
DAISY仕様2.02に準拠したSigtuna3のファイル構成は次のようになっています。
ncc.html ナビゲーションコントロールセンターファイル
*.smil スマイルファイル(同期)
*.wav 音声ファイル
[backup_files] NCCファイルのバックアップフォルダ
[source] 使用したXHTMLファイルのオリジナル格納フォルダ
atau****.html ATAU使用で追加されたXHTMLファイル
*.html idが付加されたXHTMLファイル
*.jpeg 等
ncc.htmlが録音・再生の中心的ファイルとなります。NCCアイテムの数だけ、SMILファイルとWAVファイルが生成され、NCCファイルからリンクが張られます。
ATAU(音声テキスト追加ユーティリティ)を使用した場合には、プロジェクトフォルダ内にNCCアイテム数だけのatau****.htmlが作られます。XHTMLファイルを用いてプロジェクトを開始した場合は、元のドライブやフォルダからプロジェクトフォルダにXHTMLファイルがコピーされます。また、このXHTMLファイルにイメージ画像ファイルが記述されている場合には、このファイル(JPEG、PNG)もプロジェクトフォルダにコピーされます。
DAISY仕様 2.02については以下のサイトでご覧いただけます。
DAISY Consortium
URL:http://www.daisy.org/publications/specifications.asp(英文)
プロジェクトをCD-Rに書き込む場合には次の条件を守ってください。
JOLIET
MODE 1
DAISY仕様では、プロジェクトのファイルをドライブのルートに置くことになっています。discinfo.htmlファイルは、プロジェクトを1つのメディアに複数書き込むときに採ることのできる方法です。日本では1メディア1タイトルという原則が作られていますが、便法として、この方法に則ってフォルダとこのファイルを書き込んでいます。
CD書き込みにあたっては、このdiscinfo.htmlファイルとプロジェクトフォルダをルートに書き込んでください。
discinfo.htmlの記述は以下のとおりです。
<?xml version="1.0" encoding="Shift_JIS"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ja" lang="ja">
<head>
<title>CD Information</title>
<meta http-equiv="Content-type" content=text/html; charset="Shift_JIS" />
</head>
<body>
<a href="./norma05/ncc.html">ノーマライゼーション 5月号</a>
</body>
</html>
ncc.htmlファイルの前のパス名とaタグで囲まれた図書名の個所を書き換えて活用します。
一般的なADPCMとは違うもので、ラビリンテン(スウェーデン)独自の4bit圧縮フォーマット。DAISY再生機器または再生ソフトウェアでは再生することができるフォーマット。
ATAUはAudio Text Addition Utilityの略で、「音声テキスト追加ユーティリティー」といわれる。見出しと音声のみの図書にテキストを付加するツール。
データを書き込むことができるCD(光ディスク媒体)。一度だけ書き込みが可能で、物理的に書き換えることができない。
何度でも消去・書き込みができるCD(光ディスク媒体)。反射率が低いため読めないCD-ROMドライブもあり、注意を要する。
Digital Accessible Information Systemの略。
DAISY DTBのために開発されたツールおよびプロダクトはデイジーコンソーシアムによってテストされ、承認されなければならない。承認されたツールおよびプロダクトにはDAISY OKが与えられる。
DAISY Specification。DAISY仕様。現在の仕様は2.02である。
Dublin Core(ダブリン・コア)。デジタルコンテンツの書誌情報をWeb上で容易に検索できるようにするための取り決め。現在15の要素が定義されている。
DAISY仕様では、基本的に1つのメディアに収めるプロジェクトが1つの場合、プロジェクトファイルをすべてルートに置くことになっている。プロジェクトファイルをルートに置かず、フォルダに収める場合、または複数のプロジェクトを1つのメディアに収める場合には、NCCへのリンクを記述したXHTMLファイル(discinfo.html)が必要となる。
Digital Talking Bookの頭文字をとったもの。日本語では、デジタル録音図書。DAISY DTBとしてよく使われる。
Hyper Text Markup Languageの略。メモ帳などのテキストエディタで編集可能なわかりやすい言語。
アイディー。同一ファイル内で一度しか定義できない。SMIL上ではシンクロの単位に定義され使われる。
Joint Photographic Expert Groupによる静止画圧縮方式。圧縮率を10%程度まで任意に設定できる。
DAISY DTB再生用のアプリケーション。マルチメディアプロジェクトの再生も可能。LpPlayer日本語版がリハ協から提供されている。
Markup Definition Fileの略。XHTMLを使ってプロジェクトを新規作成するときに必要なエレメント、アトリビュート(例えば、タグ、階層、クラスやidなど)を設定するファイル。
Musical Instrument Digital Interfaceの略。MIDIは、シンセサイザー、シークエンサー、コンピュータ、リズムマシン等の間を接続するための規格。
MPEG Audio Layer-III。ファイルサイズを小さくでき、音質に優れている。
Navigation Control Centerの略。ナビゲーション・コントロール・センター。図書内のナビゲーションが目的。
ToCと音声のみのプロジェクトの場合に、NCCアイテムごとの階層変更、NCCアイテムの入れ替え・移動ができる。
NCC内で参照される個々の見出しまたはページ。
Pulse Code Modulation。信号を短い時間に区切り、その信号の強さをデジタル数値に変換する。22050Hz、16bitは1秒間に16ビットデータを22050回採ることを意味する。
Portable Network Graphics。特許が絡まないW3C推奨の画像圧縮形式。
QAはQuality Assuranceの略。Sigtuna3に内蔵されたプロジェクト検証用のユーティリティ。配布されるプロジェクトがきちんと動作するか確認するために使用する。
Synchronized Multimedia Integration Languageの略。Tocのみの図書の場合はクリーンアップ時に、シンクロされた図書の場合はNCCファイルが作成される時に、NCCアイテム一つに対して一つのSMILファイルが作成される。DTBで必要なテキストと音声のシンクロを可能にしている。
Table of Contentsの略で目次、見出しを意味する。NCCアイテムと同義に使われたりする。
ウインドウズでの音声データ標準ファイルフォーマット。拡張子はwavが使われる。
eXtensible Hyper Text Markup Languageの略。HTMLをXMLに適合するように修正し定義しなおした言語。DAISY2.02仕様では、HTMLではなく、XHTMLを使用することになっている。
eXtensible Markup Language(エックスエムエル)。自分の目的に応じてタグを定義することが可能。
特殊な計算方法を用いて、保管を目的としてファイルのサイズを縮小すること。Sigtuna3では、PCMファイルからMPEG Audio Layer2、ADPCM2への圧縮変換出力ができる。
NCC要素に含まれる音声やテキストのコンポーネントのこと。NCCはSMILファイルにリンクしていて、SMILファイルには音声イベント、テキストイベント、画像イベントがある。音声イベントはフレーズともいう。
最初にリンクのあるテキストイベントがあり、音声の分割・結合・移動、テキスト・イメージの移動ができるグリッド状の画面。SMILの記述を反映している。編集画面の右側上部にある。
音声ファイルをインポート(ファイルの取り込み)することができる機能。ただし、インポートする音声によっては編集できないフォーマットもある。
録音モードの1つ。通常はこのモードで録音をする。
音声の圧縮を使用すれば、PCMファイルのプロジェクトをMPEG Audio Layer2、ADPCM2、DVI ADPCM、PCM形式で出力ができる。その他、マスターSMIL、LpStudio PROプロジェクトへのエクスポートもできる。
アナログテープからの変換や家庭録音では、雑音の除去や低域カットなどEQ(イコライザー)を用いたりして最低限の補正が必要。 DC Offsetのズレのチェックも重要である。
構造と一部テキストによるDTB。ソースファイルには、図書の構造、索引や用語集などキーワード検索やテキスト検索に必要なテキストが含まれている。
Smil Editorとも呼ばれ、音声波形ソフトのように細かな編集ができる。編集結果はSMILファイルに反映される。
「編集画面」で音声イベントを選択すると音声再生に合わせて表示される。この表示上で位置指定をすることで、音声イベントの分割ができる。
構造のあるDTB。マークアップした言語(HTMLなど)には図書の構造が含まれ、ここには注のようなリンクも含まれる。エンドユーザーはNCC内のリンク先へナビゲーションが可能。
構造なしのDTB。DTBの中で一番簡単な図書。構造が必要とされない図書に用いられる。エンドユーザーによるNCC内のナビゲーションは不可能。
構造と完全なテキストのDTB。この形式が制作上一番複雑だが、エンドユーザーに最高のアクセスを提供する。音声とテキストはシンクロしている。
直訳では「測定」。ノイズスレッシュホールドレベルを検知する。設定した録音状態で無音部分の閾値を測定し、その値以下の部分は無音とみなされる。
目的に添って任意に定義でき、何度でも記述できる属性。Class属性。
NCCアイテムのクリーンアップ、プロジェクトのクリーンアップ、不要ファイルの削除のメニューがある。1つのNCCアイテムごとにSMILファイルを作成したり、編集されたSMILの整理をする。
デジタル録音ではピークは0dBを超えないことになっているが、アナログ録音では0dBを超えることもある。アナログ信号(ダイレクト録音またはテープ転送)が0dBを超えると、デジタル音声信号のピークは0dBに達し、その値がそのまま保持される。この状態が約10サンプル続けば「クリッピング」が起こり、音声に歪みが起こる。高い入力レベルのデジタル録音で起こる歪みは、アナログ録音で起こるよりも顕著で不快な音となる。アナログ入力のピークが0dBを超えないように、録音レベルをコントロールすることが重要。
階層を使って整理した図書の内容。図書のある個所から違う個所への移動を容易にする。例えば、パート、章、節、ページなどほとんどの本には構造がある。
COder(符号化するためのソフトウェアおよびハードウェア)とDECoder(複合化するためのソフトウェアおよびハードウェア)の複合語。コーデックは非圧縮のWAVEファイルを保管や転送のために小さく圧縮されたデータに符号化する。また、コーデックはデータを再生用に複合化する。
アナログ信号からデジタル信号への変換(AD変換)を1秒間に何回行うかを表す数値。単位は「Hz」。ある音を正確に記録し再現するには、その音の周波数の倍程度の周波数でサンプリングすることが必要といわれている。サンプリングレートが高いほど録音できる周波数帯が高くなる。
デイジーコンソーシアムで必須事項とオプション項目に分けている。メタデータとしてncc.htmlファイルに書き込まれる。
同期。音声にテキストやイメージを、またはテキストに音声を同期させる。「編集画面」でテキストイベントの次に音声イベントがあれば、その音声イベントはその前のテキストイベントにシンクロ(同期)していることになる。
CSS(Cascading Style Sheet)。XHTMLが構造を示すのに使われるのに対して、見栄えやレイアウトなど表示に関する指定をするのがスタイルシート。XHTMLファイル内に記述する方法やファイルに分けて使用する方法がある。レイアウトを何度も定義することがないので、統一された表示ができる。採用にはアクセシブルかどうか注意を要する。
録音モードの一つで、あるイベント位置を選んだ場合、そのイベントの前に音声イベントとして録音するモード。
マークアップされたテキストファイルで図書の内容が記述されている。ソースファイルの記述は、図書の全内容であったり、ユーザーが検索を容易にするために見出しとページ番号だけの場合もある。
振幅の最大値と最小値の比率。
構造のあるe-テキスト。マークアップした言語(HTMLなど)には構造と図書の全文のテキストが含まれる。音声ファイルはない。
音量、電力または電 圧の大きさなどをわかりやすく表した単位。1デシベルはベルの10分の1である。
「編集画面」「メイン画面」「QA Player」で左の一角にNCCファイルの持つ階層構造をツリー状に表示する。
DTBのコピーで、再生用機器で使用するように作成される。通常、DTBのサイズを一枚のCD-ROMに収まるように圧縮したりする。一枚のCD-ROMに収まらない場合は、複数のCD-ROMに分けることもできる。
最大振幅値のことでdBであらわされる。デジタルの分野では、0dBがデジタル最大値(0dBFSともいう)である。デジタルピークレベルは0dBを超えることができない。
図書制作の最終段階。図書が完全にできあがり、保存用マスターおよび配布用マスターを制作する。
記録ディスクに保存されたデータやプログラムの個々のまとまり。コンピュータのファイル(始まりと終わりが定義されているデータのかたまり)はハードディスクやCD-ROMなどの保存用メディアで保管される。
コンピュータにはいろいろな種類のファイルがある。拡張子をつけることによってファイルの種類を判別することができる。通常、拡張子は3文字で、ファイル名のあとの「.」以降のことをいう。例えば、「wav」「mp3」という拡張子がついたものは音声ファイルであり、「txt」という拡張子がついたものはテキストファイルである。最近では、3文字以上のものもある。
WWWブラウザのようにncc.htmlやソースのXHTMLファイルを表示する。4つのモジュール(メイン画面、編集画面、ATAU、QAプレーヤー)にこの画面が配置されている。
構造とフルテキストに一部分に限定された音声のDTB。マークアップした言語(HTMLなど)は構造と図書のテキストが含まれる。音声ファイルには一部テキストの録音が含まれる。エンドユーザーはテキスト内とリンクされた音声にナビゲートできる。
録音中に音声入力を解析し(ポーズ=無音部分を検出)、音声をフレーズに分割記録する。フレーズはポーズからポーズまでの音声のつらなりで、これを音声編集の最小単位としている。
ToCと音声のみのプロジェクトに、編集画面を使って音声イベントの前にページリンクを挿入することができる。
Sigtuna3の持つモジュールの一つで、音声イベントの編集、テキストシンクロ、イメージシンクロを行う重要な画面。
圧縮せずに保存するDTBプロジェクト。プロジェクトそのもののコピーで、後に編集を加える必要がある場合などに使用する。
1つ以上のメディアを統合したプレゼンテーションのこと。DTBの場合、テキストと音声の統合がわかりやすい例である。
フルテキストのDAISY図書のこと。ToCと音声のみの録音図書と区別して使われる。
ドキュメントの内容を説明するために使われる要素。データについての解説データ。メタデータ情報は書誌情報と保管目的のために使用される。
リモートコントロールをシリアル接続し、録音および簡単な編集ができるようになっている。現在対応しているのはRE-11という機種で(株)プレクスターで販売している。
この設定では、録音フォーマット、フレーズ検知、録音モード、デバイス設定を指定できる。
音声録音のサンプリング周波数、チャンネルを指定できる。録音図書の場合、通常PCM、22050Hz、モノラルが使用されている。
戻る / 目次 / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 演 / 付
Copyright 2004 財団法人 日本障害者リハビリテーション協会
このマニュアルの全部または一部を無断で複製または複製物を頒布・公開すると著作権の侵害となりますのでご注意ください。