音声ブラウザご使用の方向け: ナビメニューを飛ばして本文へ ナビメニューへ

  

講演3. 楽しい・簡単・アクセシブル 「でんでんコンバーター」によるEPUB制作

高瀬 拓史(イースト株式会社 EPUBエバンジェリスト)

スライド1

(スライド1のテキスト)

こんにちは。イーストの高瀬と申します。私のお話は他の皆さまのお話に比べると、ずいぶん砕けた感じになると思いますがよろしくお願い致します。私はでんでんコンバーターというEPUBの制作のサービスを作りまして、今回のお話はそちらのご紹介となります。

スライド2

(スライド2のテキスト)

2011年にEPUBを縦書きできるようにしようという総務省の事業がありまして、そちらに参加することで、今の会社に行くようになりました。それ以降は、EPUBを普及させるような取り組みをいろいろ行っております。あとは個人で、電書ちゃんねるという、電子書籍をテーマに扱った、ちょっと技術よりのブログをやっています。このように、趣味も電子書籍、仕事も電子書籍ということですので、どっちの立場でも、私の話すことは変わりません。

「What is EPUB3?」というオライリーから出ている本があるんですけど、その翻訳を行いまして、今年の5月ぐらいに「EPUB3とは何か?」という名前でオライリージャパンさんから刊行いただきました。この著者のマットさんが、DAISY等の策定にも非常に関わっていらっしゃる方でして、DAISYの考えがEPUB3にどのように取り入れられているか、といったことも書いてあります。ちょっと凝った英語を書く方なので、日本語にするのは結構大変だったんですけれども、無料で読めます。ただし電子版のみ、EPUBとPDFとKindle本のみということになっていますので、もしそういった環境をお持ちでしたら、読んでいただければと思います。

あと、これはカミングアウトするのは初めてなんですけれども、軽度のADD、ADHDの多動のないバージョンですね。注意欠陥障害というものの診断を受けたことがあります。部屋も、私の部屋も、仕事の机の上もかなり散らかっていて汚いですし、普通に一人暮らしをすると、電話も電気も水道もいつのまにか止まってしまったりしています。家族とか会社の方とかのサポートを受けて、一応人並みの社会生活は送れております。

スライド3

(スライド3のテキスト)

こんなアイコンで、よくプレゼンのほうには登場します。

スライド4

(スライド4のテキスト)

では、まず、DAISYとEPUBの関係、ちょっと歴史を振り返ってみたいと思います。

DAISY3は、ANSI/NISO Z39.86-2005という2005年の規格ですが、EPUB2ができたのが2007年ですから、その少し前といえます。当時私はEPUBについて知りませんでしたが、今、EPUB2の仕様を見ると、非常にDAISY側からEPUB2への働きかけというのが大きかったことがわかります。

例えば、NCXと呼ばれる目次です。これがEPUB2に取り入れられていますし、ガイドとかページリストといったナビゲーションが入っています。それから、DAISY3は、DTBookという、専用のXMLで記述するのですが、こちらもEPUB 2に取り込むことができるようになっていました。この他にオーディオやビデオなどのマルチメディアがあります。DAISY3はマルチメディアDAISYと言われることがあるように、マルチメディアを扱うことができましたが、残念ながらEPUB2では扱うことができませんでした。

スライド5

(スライド5のテキスト)

これがEPUB3になりますと、さらにアクセシビリティ強化されまして、マルチメディアも扱えるようになりました。あと、音声同期を実現させるために、既に録音済みのオーディオとテキストを同期させるメディアオーバーレイズという仕組みが入りました。他に、PLSという、機械で読み上げさせるときの発音情報を辞書のようにして持たせる仕様も加わりました。SSMLも同じく発音情報を入れる仕様です。それから CSS3 Speechというモジュールがあります。ここは男の人の声で読んでください、ここはこのくらいのボリュームで読んでください、とったことをスタイルシートで指定するものですが、これも取り入れられています。そして、日本語の本にとって大事な、縦書きとかルビなどの表現も取り入れられました。今の日本の電子書籍市場は、EPUB3ができて、ようやくスタートできたといえます。

スライド6

(スライド6のテキスト)

一方、その後も2012年にDAISY4というものが策定されました。こちらは、今までとちょっと違うので、アイコンを変えています。DAISY3は本の形をしています。DAISY2も本の形をしています。これは配信フォーマットを意味しています。ある人は、EPUB2で本を読みますと。ちょっとプリントディスアビリティのある人はDAISY3で本を読みますというものなんですけれども、DAISY4は、読むための配信用のフォーマットではなくて、オーサリング・アンド・インターチェンジ・フォーマットといいます。これはどういうものかというと、1回DAISY4という専用のXMLでコンテンツを作って、これをDAISY Pipelineなどのソフトウエアを使って、いろんなフォーマットに変換して読むという、関係になります。EPUB、点字図書とか拡大図書とか、そういったものに変換するわけです。ですので、普通の人であっても、プリントディスアビリティの人であっても、実際に配信される電子書籍はEPUB3、という形になってゆきます。

スライド7

(スライド7のテキスト)

障害のある人専用の電子書籍のフォーマットで読む時代というものは終わりまして、誰もがEPUB3で読む時代が来るのではないかと期待されているわけなんですが、いろいろ課題はあります。

スライド8

(スライド8のテキスト)

EPUB3が取り入れたいろいろな機能に全部対応したリーディングシステムはまだ存在していません。EPUB3ができて2年ぐらいになりますけど、まだ存在してないんです。特にアクセシビリティに関係するものは遅れています。メディアオーバーレイズに対応したものはまだ数が少ないです。PLS、SSML、CSS3 Speechは、そもそも対応した日本語の音声合成エンジンがほとんどありません。といった感じで、折角の仕様をうまく活用できてないのが実情です。こうしたコンテンツを作るための制作ツールも少ないですし、制作のノウハウも蓄積されていません。

スライド9

(スライド9のテキスト)

DAISY側にもやっぱり課題はあります。日本での主流は、私の聞く限り、DAISYの2.02が中心です。次のDAISY3に追いつけたとしても、やっぱり日本語に縦書きやルビは使えません。だからEPUB3への期待が大きかったわけですが。

時代はどんどん進んでいきますので、過去のソフト、DAISY用のソフトも、だんだん時間がたつにつれて、使えなくなってゆきます。例えば、Sigtuna DAR 3 JPという制作ソフトがありますが、Internet Explorer 7以下でなければちゃんと動きません。このような事例がこれからどんどん出てくると思います。

DAISYは、専門の、そういう分野に特化したフォーマットですので、汎用的なEPUB3に比べると、ノウハウもさらに少ない状態だと思います。次の受け皿となるこのDAISY4ですけども、これはかなり高度で複雑なものですので、誰もが簡単に作れるものにはならないのではないかと、申し訳ないのですけど私は思っています。 多分、本当に重要ないろんな形で使うべきコンテンツというものはDAISY4で作って、そうではない、簡単に使える、手軽に作れるコンテンツっていうのはEPUB3で直接作る、そういう形になっていくのではないかと私は思っています。

スライド10

(スライド10のテキスト)

ということは、EPUB3の製作ツールがやっぱり必要です。

スライド11

(スライド11のテキスト)

スライド12

(スライド12のテキスト)

そこで、誰もが簡単に作れる制作ツールを作ってみましたというのが今回のでんでんコンバーターになります。

スライド13

(スライド13のテキスト)

これは私の個人プロジェクトです。無料で使える、ブラウザでWebサイトを訪れて使う、Webアプリケーションです。テキストや画像をアップロードすると、仕様に従ったEPUB3というものを出力してくれます。

最近、自分の作品をEPUB3で作って、電子書籍のストアで売るというのがだんだんブームになってきているんですけれども、ストアごとに癖があったりとかしまして、特別な対応が必要だったりします。そこででんでんコンバーターでは、いろんなストアで共通して使えるようなEPUBを出力するというマルチベンダー対応を行っています。あと、弊社のほうでこれは商用利用の、カスタマイズとかのお問い合わせ先を承っております。

スライド14

(スライド14のテキスト)

初めに、どういったツールを作ろうかと考えたんですけど、実際、EPUB3を制作するツールにはいろんなものがあります。紙の出版物を美しく表現するもの、シンプルなコンテンツを誰でも作れるもの、高度で複雑なことができるもの。

スライド15

(スライド15のテキスト)

今大事なのはどれだろうと考えて、私が選んだのはこれです。シンプルなコンテンツを誰でも作れること。先ほど、石川先生がおっしゃったような、やっぱり質より量というものを重視するのと非常に近いアプローチだと思います。そ

スライド16

(スライド16のテキスト)

入力はテキストファイルです。最もアクセシブルなデータはテキストであると言われるぐらいテキストは重要なものです。一方で、テキストの弱点は構造化です。このテキストは、一体どんな意味を持っているかということです。通常のテキストデータでは普通の地の文と見出しを区別することができません。れを何とかカバーしようとして生まれたのがハイパーテキストと呼ばれるものでして、HTMLもその一例です。これは見出しですよ、と示すようなタグと呼ばれる印を書くものです。しかしそれも複雑になってくると、だんだん作るのが面倒くさくなってくる。もっと簡単な印でそういった意味付けをできるようにしよう、ということで生まれたのが簡易マークアップ言語のMarkdownと呼ばれるものです。これを私が独自にちょっと拡張したものが、でんでんコンバーターで使うでんでんマークダウンです。

例えば、見出しはシャープで二つ印を付けるとか、段落は普通に文章を書くんですけれども、強調したい箇所はアスタリスクで囲んだり、二つのアスタリスクで囲んだりします。引用文は先頭に大なりマークですか、こういった記号を付けて引用を表します。

スライド17

(スライド17のテキスト)

これのメリットというのは、やっぱり読みやすい。そして、簡単に書けますし、後から手直ししたいとき編集しやすいです。それから、これ見出しですよとか、そういったことを簡単に残せるので文章構造を意識しながら、本を作ることができる。こういうメリットがあります。

スライド18

(スライド18のテキスト)

HTMLをベースにしたEPUBのコンテンツは一度作るのはみんなできるんですが、後から手直しするのって結構大変だったりするんです。上が、ルビ入りのものなんですけれども、「電子書籍と紙の本」っていうのをルビ入りで書くと、こんな感じになりますよね。それが後から「いや、『電子書籍』じゃなくて、『電子出版物』にしたいから直してよ」っていうとき、これ一個一個見るのって非常に大変だったりするわけなんです。でんでんマークダウンはルビも対応してまして、下のように書きます。これだったら直しやすいと思います。こういう特徴が、いろいろ入っています。

スライド19

(スライド19のテキスト)

スライド20

(スライド20のテキスト)

これを使って、いろんな本が作れます。技術書もありますし、小説もありますし、もっとハウツー本もありますし、いろいろあります。

スライド21

(スライド21のテキスト)

スライド22

(スライド22のテキスト)

スライド23

(スライド23のテキスト)

スライド24

(スライド24のテキスト)

スライド25

(スライド25のテキスト)

スライド26

(スライド26のテキスト)

(ここでデモ)

スライド27

(スライド27のテキスト)

では次のお話にいきます。音声読み上げです。これはちょっと今の課題です。まだでんでんコンバーターは、メディアオーバーレイズという音声とテキストを同期させたEPUBを制作できません。誰かがしゃべった声を録音するとか、音声合成エンジンも持っていませんので機械に読ませた音声ファイルを自動的に作成するという方法もとれません。ちょっと私だけでは限界があります。

ただ、DAISYコンソーシアムが公開しています、TobiというWindows用のソフトがあります。これは、EPUBをインポートして、DAISY音声付きの、EPUB 3ですとかDAISY3を出力することができます。これに、でんでんコンバーターで作ったものを取り込んで、音声を付けていただければと思います。

スライド28

(スライド28のテキスト)

リクエストいただいていまして、段落より細かい、センテンスといった単位で、音声の選択ができるようなタグを出力してほしいというものがあります。ちょっと時間かかっていますけども、やりたいと思います。こんな感じです。Tobiで読み込むとテキストの場所が選択されて、そこに対応するのが左隅の場所で、赤いマーク、こちらで押すと、マイクとかでそこに対応する音声を録音することができますし、フォルダ、これをクリックすると、あらかじめ録音済みの音声ファイル、mp3とかを割り当てるという、そういったことができるようになります。

1ページだけ作ってみました。ちょっとまだReadiumが開発中のようで。もう次のページいっちゃいます。ちょっとまだ実装にこちら課題があるようです。すみません。スピーカーあった。聞こえました、皆さん。私の、音声録音して、音読しても誰も喜ばないと思うので、ちょっとさとうささらちゃんという、歌と朗読が上手なソフトウエアに読み上げてもらったんですけれども。結構使いやすかったです。

あと、もう一つは音声読み上げ、機械で読み上げさせるときはどうしようというものがありましたけど、これはちょっと対応したアプリというものを、増やしていただくしかないかなと思います。今ですとiPhone用のVoice Dreamというものが、EPUBも取り込むことができますので、これで、結構まあまあ品質的には。私があまり品質的にはそれほど詳しくないですけども、一応読み上げることはできます。

スライド29

(スライド29のテキスト)

まとめです。でんでんコンバーター、今までは普通の人はEPUB2を作って読んで、ハンディキャップのある人のものは、専用のDAISY3と専用の制作スキルが必要なツールを使って、制作するしかなかったんですけれども、今は、EPUB3一つに集約されてゆくでしょう。でんでんコンバーターは、どちらの目的にも使える汎用的なツールというものを、目指していきたいと考えております。でんでんコンバーターが単独でできることは、やっぱり限られていますけれども、TobiとかVoice Dreamのように、いろんなソフトと組み合わせることで、かなり高度なこともできるようになるのではないかと思っています。

スライド30

(スライド30のテキスト)

ちょっとDAISY教科書も作ってみようとしたんですけども、限界がありました。ページごとのリンクの貼り方が難しかったり、やっぱりタグの手打ちが必要だったりします。でんでんコンバーターにアップロードできるファイルが50なんですけれども、教科書に使われる画像は、それだけで何百とかあったりするので、1冊作るというのは、ちょっとパワー不足だなというのもあります。教科書だけが本じゃないと思いますので、とにかく何でも、テキストさえあれ簡単に作れるツールにはなっています。ですので、とにかく読みたいなと思ったものを、ご自分のためでもいいし、ご家族のためでもいいですし、他のみんなのためでもいいです。楽しみながら作っていただければと思います。

スライド31

(スライド31のテキスト)

思いはここです。DAISY2.02、DAISY3ですと日本語対応が不十分、専用技術が必要だった。DAISY3はそれ、EPUB3で解決されつつあるんですけれども、ちょっとツールとノウハウと実装が遅れと、いろんな壁があると。ここを何とかしたいというのが、私のでんでんコンバーターの思いであります。ぜひ使っていただければと思います。

スライド32

(スライド32のテキスト)

ありがとうございました。


高瀬氏のスライドシェアのページ:
でんでんコンバーターによるEPUB制作 - SlideShare
http://www.slideshare.net/lost_and_found/dendendaisy