デイジー教科書製作の技術的な問題
目次
技術的な課題
現状のデイジー教科書製作の技術的な課題の原因として、主に次のものが挙げられます。
- 教科書が紙への印刷を前提として製作されているため、並べる順番等の判断が難しいです。 
 → 教科書製作の初期の段階から構造化を意識することで改善されます。
- 提供されているデータがDAISY化を想定したものではなく、PDFとテキストデータであるため、ルビをすべてつけなおして校正する作業等が発生しています。 
 → DAISY化も視野に入れた、EPUBやHTMLでのデータ提供がされることで、ルビをつけなおす作業等が軽減されます。
- 製作ツール、再生ツールの選択肢が増え、すべての環境での校正への対応が難しくなっています。 
 → 一つの再生ツールで校正ができるような製作環境が必要です。
- 既存ブラウザの縦書き・ルビへの対応の違いがあります。 
 → ブラウザの開発元への働きかけが必要です。
- DAISY2.02規格で縦書き・ルビがサポートされていません。 
 → EPUB3への移行が必要です。
- 教科書通りのルビと全ルビ、使用するフォントなど、個別ニーズの要望があり、対応の人手が足りません。
 →再生ツール側での対応により、コンテンツの作り替えを行わずにすむのが理想的です。
規格の意義
本来、規格の意義は、 
  DAISY規格にあった製作ツールを使えば、 
  DAISY規格にあったコンテンツができ、 
  DAISY規格にあった再生ツールで再生できる。 
  つまり、どのDAISY製作ツールを使って作っても、どの再生ツールでもちゃんと再生できるというのが本来あるべき姿です。 
  ところが、規格では規定されていても、縦書き・ルビの表示はブラウザによって違うのが現状です。DAISY再生ツールの多くは画面表示に既存のブラウザを採用しているため、ブラウザでの表示の違いが問題になります。アップデートによって状況は改善されつつありますが、DAISY規格にあったコンテンツであっても、再生ツールやOSによっては表示が崩れてしまうという問題が発生しています。 
  また、DAISY2.02規格では縦書きとルビがサポートされておらず、日本では独自拡張せざるを得ませんでした。 
  ウェブの世界でも同じですが、このような目先の問題を解決するために、コンテンツを作り変えてしまったり、規格を独自拡張してしまうと、ブラウザのアップデートの度に、表示が崩れてしまったり、DAISY2.02からEPUB3に変換する際に、コンテンツ側に特殊な編集がされていることで、上手く変換できなくなってしまう等の問題が発生します。 
理想的な方針
- コンテンツは、できるだけシンプルにして、なるべく共通のCSSを使う。これにより、年度ごとの細かい修正とアップのしなおしや、DAISY2.02からEPUB3への変換の際に、レイアウトが崩れる問題の発生を最小限に抑えることができる。 
    - 共通のCSSを使う。(コンテンツごとにCSSが違うと、アップデート時に混乱したり、レイアウトが崩れたりする。場合によっては、コンテンツを製作した特定の製作者でないとアップデートできなくなってしまう。)
- HTMLの基本方針に沿って、内容はHTMLファイルに記述し、レイアウトに関することはCSSに記述して、内容とレイアウトを分離する。このことにより、毎年の内容の更新時等にスムーズにアップデートできる。
 
- DAISY規格に合っているコンテンツで、表示に問題がある場合は、できる限り再生ツールやブラウザ側で問題を修正する。コンテンツ製作者が表示に合わせて作り替えることはなるべくしない。 
    - 表示等の問題を製作者と、ツール開発者で共有する。
- 製作ツールの問題、コンテンツの問題、再生ツールの問題、ブラウザの問題、規格の問題等、問題の切り分けをして、本来対応すべきところが対応するように体制を作る。
- ブラウザ側に問題がある場合は、ブラウザ側での修正をしてもらうように働きかける。また、規格に問題がある場合は、規格の修正をしてもらうように働きかける。
 
- EPUB3へ移行する。 
    - DAISY2.02規格では、縦書きとルビがサポートされていないが、ブラウザでは工夫によって表示できるため、規格を独自拡張したものを作成しているのが現状である。そのため、バリデータ、製作ツール、再生ツール等で問題が発生する。この状況を回避するため、縦書きとルビがサポートされている、EPUB3規格に移行していく方向で開発を進めていくことが必要です。
 
デイジー教科書製作ボランティアの技術的な課題
再生ソフト
- 再生ソフトにより(AMIS、EasyReader、VOD)表示の仕方に違いがあるため、それぞれの再生ソフトでの再生確認が必要となり、手間と時間がかかる。
- パソコン、iPad、スマートフォン等での再生確認をするために、機器やソフトを購入する必要があり費用の負担がかかる。
- OSのバージョンやブラウザのバージョンによって表示に違いがある。再生ソフトと、OS、ブラウザのバージョンの組み合わせは無数にあり、再生確認が大変である。
- 再生ソフトによる表示や再生の違いをカバーするために、コンテンツの作り方で工夫をして作り方を変えている。そのため、同じ図書を複数バージョン製作したり、cssを変えたりしなければならない。一つの再生ソフトの問題をカバーするために修正すると、別のソフトで問題が出たり、ソフトのアップデートの際に問題が出たり、OSやブラウザのアップデートの際に問題が出ることがある。  
 
 
- DAISY2.02でルビと縦書きがサポートされておらず、無理矢理にスタイルシートで固めているため、縦書き、ルビなどの表示の問題が頻繁に発生する。
事例1:現行cssで、フォントを明朝体に変えても、VODで反映しない。
現行のcssのままでゴシック体を明朝体にかえてもVODでは反映しないため、VODは別のcssに書き換える必要がある。VODを明朝にするcssではEasyReaderと AMISでは横書きになってしまう。
事例2:縦書きでルビの表示がずれる
  
    縦書きで、二文字の漢字に二文字のルビをつけた場合に、VODで表示したときに、上の一文字部分にだけルビが振られてしまう。漢字に対してルビが均等にふられるようにしてほしい。(ルビの配置がずれる問題は、webkitの問題)
事例3:ソフトのバージョンアップで表示が変わる。
  VODの縦書きについて、ソフトのバージョンアップや縦書きCSSの変更の際に、製作者に連絡がほしい。 
    → デイジー再生ソフト・器機やオーサリングソフトを開発しているメーカーや団体と各デイジー製作団体が情報共有できる枠組みが必要  
事例1:縦書きスクロール
  AMISは縦書きのスクロールに問題があるため、縦書きの場合に画面内にテキストが収まるようにhtmlファイルを複数に分ける必要がある。
   
  事例2: ルビと棒線
  iPadのブラウザでは、縦書きの棒線が右側でなくて左側に表示されてしまう。また、縦書きのルビのある個所に棒線があると表示がおかしくなる。このような場合にはHTMLとCSSのソースを開いて解決策を探さなければならない。また、どうしても上手く表示できない場合は、妥協点を探す必要がある(VODで、ルビと棒線が共存できないので、棒線ではなくて太字で対応した等) 
録音
- パソコンでのダイレクト録音はノイズが入りやすい。
- アクセントの修正が多々ある(肉声、TTS(合成音声)とも)。方言の修正もある。
- 合成音声は漢字の読みの修正が必要。
- 合成音声は間の取り方の修正が必要。
- 読むスピード、感情を入れるか入れないか、どのような声が良いかなど、利用者によってニーズが違う。
- 特に国語や英語に関しては、教科書出版社が発行している音声の入ったCDの音を活用できると、より良い質のものを製作できると思う。
利用者の個別のニーズへの対応
- 全ルビの希望が多い。
 要望があれば、教科書通りのルビと、全ルビの2種類を作ってアップしている。
 校正や更新作業も2倍の作業になる。
- ハイライトの区切り方の希望が利用者によって違う。
- 使用するフォントの希望が来る(ゴシック体、明朝体等)。
- 個別ニーズへの対応は、製作の際に、そのたびにコンテンツを作りかえるのではなくて、再生ソフト/ツール側で変更できるのが理想。
製作
- 製作ソフトが有料でボランティアの費用の負担が大きくなる。特にこれから参加しようとするボランティアにとってソフトの選択と購入が難題。
- それぞれのソフトの互換性がないと、同じ製作グループでソフトを統一しなければならなくなる(製作、録音、校正、確認と作業を複数のメンバーで共有するので)。
- 現在は、DAISY2.02でルビと縦書きがサポートされておらず、縦書き、ルビなどの編集に対応していない製作ソフトがある。そのため、ソースを開いて編集しなければならなかったり、インポートしたり、変換したりする際に、ソフトによって開けないという問題が起こる。
- バリデータによって結果が違うため、どうやって確認すればよいか分からない。
- 提供されるデータが、ルビをルビとして扱うことができないPDFとテキストデータであるため、DAISY化の際にすべて一から入力しなければならず、ルビ付加の作業とルビの校正作業に大変な手間がかかる。PDFからコピーすると、本文の文字とルビ文字が不規則に混在する。
 文科省がボランティアに提供するデータをEPUB3にしてもらえると、ルビをルビとして扱えるので、状況を改善できる。
アップロード
- 数式の入った理数系の教科書の場合、現在、数式を画像データで入れているが、再生ソフトによって画像のハイライトの仕方が異なることもあり、再生ソフトに合わせて出力を変えており、同じ図書を、2バージョンアップしている。
- サーバーにアップするものはmp3に圧縮しなければならず、マスターはwave版を保存しなければならないので、1つのコンテンツを、毎回wave版、mp3版作成しなければならない。
- 各図書にEasyReader Express(再生ソフトをインストールしていないPCでDAISYを再生できるよう図書に付加して使う再生ソフト。インストールが難しいユーザーや、学校のPCで利用できる。)を付加してアップしなければならない。
修正作業
- 校正者、確認者からの指摘による修正。
 htmlファイルの移動、差し替え、テキストと録音修正、画像の移動、見出しの修正
- 教科書の毎年の訂正(画像の差し替え、テキストの変更) 
 
レイアウト
製作作業にはいる前に、どのように製作を進めていくか教科書ごとに検討する必要があり、相当な時間がかる。 
  
  検討が必要な点 
- 読む順番はどうか。
- 画像や資料はどこにいれるか。
- 地図等の画像中の情報はどこまでテキスト化するか。
- ページごとか見開きか。(紙で見開き2ページを横断した内容の場合にどのようにするか)
- 細かい画像への対応(解像度はあげて、表示は小さく)。
- キャプションと画像が同時に見える配置(画像がスクロールしてしまってから画像説明があると分かりにくい)。
国語の例 
  
  検討が必要な点 
- タイトルをどうつけるか。
- 縦中横の扱い。
- 脚注はどこに入れるか。
- 上段下段が同時に進行する場合の扱い。
- 縦書きの表の扱い。
- 古典などで、テキストの両側に注釈等がついている場合の扱い。
- 漢文の読み順に対応するハイライトの順。
- 縦書きの場合、ルビと傍線が重なると機器やソフトによって見え方が違う。
その他
- 学校のインターネットのセキュリティで、DAISYがダウンロードできなかったり、ソフトがインストールできなかったりする。
- データを受け取れる時期がばらばらで、授業が始めるまでの期間が短かい。先生によって進度も異なり、勉強する単元の順序が異なることなどもあり、授業が始まった後の提供となる場合もある。できる限り、利用者の希望に応えようとするため、製作者の精神的肉体的負担が大きい。(2015年は下巻のデータが8月上旬に提供され、新学期が8月下旬からであった。また、8月上旬にも受け取れなかったデータもあった。)
DAISY教科書の製作に活用されているバリデータ、ルビ付加ツール、製作ツールと、課題についてのリスト
バリデータ
Shift_JISとUTF-8の両方の文字コードのDAISY2.02をまともにバリデートできるバリデータが存在しない。(古いバリデータではUTF-8の図書のバリデートはできず、最新のバリデータはまだバグが残った状態)
- HTML lint
 HTML lintはHTMLのバリデータだが、W3Cの正式なものではなく、個人の運営であるため、信頼性 についての確証がない。W3Cのバリデータは英語なので、日本語のlintを使用している場合が多い。
 ShigtunaDAR3では、HTMLファイルを準備してから読む込むため、HTMLのバリデータを活用する。
- Pipeline2 DAISY2.02 validator
 開発中であり、バグが残っている状態。
 ルビはDAISY2.02規格でサポートされていないため通らない。
- DAISY2.02 validator (pipeline2の前に開発されたもの)
 ユニコードの前に開発されたもので、UTF-8などユニコードのコンテンツのバリデートができない。
- それぞれの製作ツールに組み込まれているバリデータ
ルビ
- ChattyInfty(有償の音声付き電子書籍・教材編集ソフト)
 編集画面で、ルビを1つずつ付加できる。また、同じ漢字に対して一括付加できる。
- PLEXTALKProducer(有償のDAISY/EPUB製作ソフト)
 編集画面で、すべての漢字に対してルビの自動生成ができる。また、手動での編集や、1つずつの付加もできる。
- 秀丸マクロ(シェアウェアのテキストエディタ)
 ソースを開いて、秀丸のマクロで、一つずつ付ける。一つずつ手で打つので大変な手間がかかるが確実である。
- HTMLルビ振りツール(rubyconv.exe)(無償)
 DAISYフォルダ内のHTMLファイルを、ルビ振りツールに読み込んで、全ルビを自動生成できる。一括変換できるが、HTMLファイルによって、受け付けられなかったり、HTMLが壊れてしまう場合がある。
製作ツール
- SigtunaDAR3(申請すれば無償で提供を受けられる)
 対応OS Windows XP、Windows 2000 Professional、 Windows NT 対応出力フォーマット DAISY2.02 録音形式 肉声録音 課題: 
 ユニコードに対応していない。
 HTMLファイルを事前に準備しなければならない。
 センテンスの編集ができないので、修正等が難しい。
 既にサポートされていないWindowsが動作環境だが、未だに使用されている。
 IE8以上の環境で使用すると、ncc.htmlのソースが書き換えられてしまう。(SigtunaCorrectionを使用して、ソース修正することは可能)
- Save as DAISY(無償)
対応OS Windows 8、Windows 7、Windows Vista 、Windows XP、(Windows10でも使用可能) 対応するMicrosoft Word Microsoft Word 2013、Word 2010、 Word 2007、Word 2003、Word XP 対応出力フォーマット DAISY3、DAISY2.02 録音形式 合成音声 課題: 
 ルビ、縦書きに対応していない。
 複雑なものや大きなものは、変換できないことが多いので、シンプルで小さなものの作成に限られる。
 読み間違いの修正を行う手段が無い。
- Tobi(無償)
対応OS Windows 7、Windows Vista 、Windows XP、 (Windows10、Windows8でも使用可能) 対応出力フォーマット EPUB3、DAISY3 録音形式 肉声録音、合成音声 課題: 
 準備されたDAISYファイルを読み込んで、肉声または合成音声の録音が可能。
 事前にDAISYファイルが完成していることが前提のため、見出しやセンテンスの編集はできない。Save as DAISYで作成したDAISYファイルを読み込んで肉声録音できる。
- ChattyInfty3 AI Talk(有償) 
対応OS Windows 8、Windows 7、Windows Vista 、Windows XP 対応出力フォーマット EPUB3、DAISY2.02 録音形式 合成音声 課題: - 肉声録音ができない。
- 編集中は独自ファイルのため、編集中にソースを開いたり、出力後にソースを編集した後に問題が見つかった場合は、出力前のファイルに戻らなければならない。
- ページフレーズが文中に入れられない。(現在、段落間のみ)
- エディター画面にページ番号の一覧表示がない。
- メタデータに原本ISBNが入力できない。
- 水平線挿入・複数段落の枠囲みが簡単にできない。(現在、エディター上でhtmlタグを手書きしないといけない)
- 環境依存文字が一部、エディター上で表示されないことがある(ビルドブックしてできたDAISYでは表示されている)。
- エディター上でのみ有効でDAISY出力に反映されない囲み枠(丸囲みなど)があり、DAISYで有効な機能がどれか分かりにくい。
- フレーズの(Producerでいうところの)読み飛ばし設定ができない。
 
- PLEXTALKProducer(有償) 
対応OS Windows 8、Windows 7、Windows Vista 対応出力フォーマット EPUB3、DAISY3、DAISY2.02 録音形式 肉声録音、合成音声 課題: 編集中は独自ファイルのため、編集中にソースを開いたり、出力後にソースを編集した後に問題が見つかった場合は、出力前のファイルに戻らなければならない。 
 既知の問題と回避策(以下の問題はすべてメーカーに報告済):
 問題1)編集画面での再生確認中に、次のレベルセクション(html)への移動・再生に不具合がある。
 問題2)音声ファイルを付加したファイルエクスポートデータ(DAISYファイル前の編集データ)を再インポートした時に、音声フレーズの開始位置がずれる。メーカーのシナノケンシより当面の回避方法の指示があったが、回避処理後も稀にずれる時がある。
 問題3)枠線、表編集の問題。太字・ルビ付け等のテキスト装飾→そのテキスト箇所で枠・表の設定→枠・表内に画像を挿入の順で編集すると、編集画面上は正常でもDAISY出力後のhtmlに不具合が生じタグが表示されてしまう。
 メーカー回答:枠・表作成→画像挿入→テキスト装飾の順に編集することで回避できる。
 ※編集済の最終データに全ルビ一括処理をした時にも同じ現象が生じメーカーに確認中。
 問題4)フレーズ一覧画面(左下画面)とテキスト編集画面(メイン画面)で、各フレーズが同期して表示されているがずれる場合がある。このずれによって、ファイルエクスポートやインポート、セクション分割、フレーズ編集等、様々な処理に不具合が生じる。ビルドブック時のDAISYバリデートで不良フレーズが検出できるため、該当部分を修正することで解消。フレーズ表示の同期がずれる原因が不明なため防御策がない。
- Dolphin Publisher(有償) 
対応OS Windows 10、Windows 8、Windows 7、Windows XP 対応出力フォーマット EPUB3、DAISY3、DAISY2.02 録音形式 肉声録音、合成音声 課題: 
 編集中もDAISYファイルなので、編集中にソースを開いて編集したり確認したりすることが可能。
 既知の問題と回避策(以下の問題はすべてメーカーのDolphin社に報告済):
 
 問題1)
 HTML編集画面で、tableタグ内のテキストを選択してセンテンスを作成すると、HTMLファイルが壊れる場合がある。
 回避策1)
 先に、普通のテキストの状態で、センテンスを作成して、図書が完成した後にtableタグを入れて、見た目を整えるという順番で製作すれば回避できる。
 
 問題2)
 HTML編集画面で、次の場合にセンテンスの編集を行うと、HTML編集画面がフリーズしやすい場合がある。
 ・bold, italic, underline等の文字への装飾をしている場合
 ・縦書きのスタイルシートを入れている場合
 ・テキストのすぐ横に改行を入れずに画像がある場合
 ・<hr />を使用している場合
 回避策2)
 ・bold, italic, underline等の文字への装飾は、センテンスの編集が終わって、図書が完成した後に追加することで回避できる。
 ・縦書きのコンテンツであっても、Publisherで編集する際は横書きで行い、図書が完成した後に縦書きのスタイルシートを入れることで 回避できる。
 ・テキストの後にEnterで改行を入れてから画像を入れることで、画像の周辺での問題を回避できる。
 ・<hr />は、図書が完成した後にXHTMLファイルに入れると回避できる。
 
 問題3)
 見出しの編集画面で、×印のボタン (delete)でページを削除すると、ページのあった場所に不正なシンクロができてしまう。
 回避策3)
 音声波形エリアで、不正なシンクロを選択して、T字のマークが黄緑になっている状態で、右クリックをし、「削除」を選択すると、不正なシンク ロが削除される。
 
 問題4)
 「●」をセンテンス(黄色いハイライト)に含めないと、ビルドの際にIDに問題が発生するケースがある。
 回避策4)
 「●」はセンテンスに含めるようにする。(黄色のハイライトの中に入れてください)
 
 問題5)
 プロジェクトの新規作成で、「作成」ボタンを押したときに、「daisy202_default.mdfファイルが見つからず、プロジェクト が作成できません!」というエラーが出る場合があります。
 回避策5)
 Dolphin Publisherをアンインストールして、インストールしなおすとなおります。
 
 問題6)
 音声形式がMP3のプロジェクトをDolphin Publisherで開いて音声を編集して、ビルドをすると不具合が生じる。
 回避策6)
 Dolphin Publisherでは、音声形式がwaveのプロジェクトを編集するようにする。
 完成したプロジェクトを保存する際に、音声形式がwaveのプロジェクトをマスターとして保存する。音声形式がMP3のプロジェクトしかない場合には、クリーンアップをして、「Session Undo」フォルダなど不要なファイルを削除するなどをして、ビルドをしないようにする。