音声ブラウザご使用の方向け: ナビメニューを飛ばして本文へ ナビメニューへ

講演会「DAISYの展開」

SMILの到達点とAmbulant Player

ディック・バルターマン
CWI(オランダ国立情報工学・数学研究所)

ディック・バルターマン氏の写真

こんばんは。私の名前はディック・バルターマンです。アムステルダムのCWIからきました。ここにお招きいただき大変光栄です。河村さんに感謝申し上げます。

河村さんのプレゼンテーションの冒頭で、ここにいらっしゃるどれくらいの方がDAISYをご存知かという質問をされました。聞いたことがない方はいらっしゃらなかったわけですから、皆さんはSMILのこともよくご存知だと思います。しかし、皆さんの中でSMILのことについて何を知っているかという質問をしたらどうでしょうか?S、M、I、Lと書きますが、名前だけではなくてSMILの内容についてご存知の方は少ないかもしれません。ということで、これから数分間をかけてアムステルダムのCWIで開発したテクノロジー、それはDAISYプロジェクトに役に立つベースであり、またオープンな方法でそのテクノロジーを人々の役立てることができるのですが、そのテクノロジーのことについてお話いたします。

「目標と概観」ということで、このスライドでご説明したいと思います。プレゼンテーションの最初の部分では、SMIL2.0という言語についてお話しします。あまりにも技術的にならないように気をつけて、そのあとSMIL2.0プレイヤーについてご紹介いたします。これは本日ここに来ておりますジャック・ヤンソンという同僚と共に開発を行なっているものです。

パート1では、「SMILとは何か?」そしてもっと重要なことは、「何故それが皆さんにとって重要なのか?」ということをお話しします。数分をかけましてスライドを使って「SMIL2.0の概観」から始めたいと思います。いろいろと言葉が出てくると思います。SMILはXML言語だということです。つまり、XMLは言語を作るための言語です。エスペラント語のようなものです。W3Cがこのように定義しています。XMLはテクノロジーの世界ではとても有名です。興味深いのはW3Cが公開した最初のXML言語はSMIL1.0でした。SMILとXMLは長い間関係があったと言えます。SMILができることは、テレビや電話、コンピューターといったメディアプレイヤーに、どのメディアをいつ、どのようなコンビネーションで再生するべきかといったことを命令することです。もし、家で他に良い番組がなくてビデオをテレビで見ているなら、SMILプレイヤーは、ビデオやオーディオ、またテキストがあることを知らせます。SMILはメディアそのものではありません。本の中にあるテキストではなく、ビデオカメラが提供するビデオでもなく、オーディオでもなく、単にどのメディアをいつ再生するかということを指示します。実際それはささいなことだと思うかもしれません。

しかし、多くのメディアプレイヤーの使い方があると思いますが、SMILはその点において非常に有利です。なぜなら様々なことを行なうことができるのがSMILだからです。従来のコンピューターが行なうことにとどまりません。例えば、日本には日本の素晴らしいこのようなカメラがあり、写真をとるために使われています。多くの友人にとっては便利なカメラですが、全盲の友人にとっては、東京がどれくらい素晴らしいか、どんなに素晴らしい時を私たちが過ごしているかを伝えることができません。ですから、小さなマイクがカメラの上についていれば良いと思います。そうすれば、ホテルに帰ってから東京の地下鉄がどのようなものなのか、オーディオのキャプションをつけることができます。地下鉄の中ではうるさくてできませんし、よく聞こえる人でも何も聞き取ることはできないでしょう。

もちろん、耳の聞こえない友人にはあまり役には立たないかもしれません。音を聞くことができないからです。写真を見ることができる場合は、テキストをつけると、写真とともに説明をすることができます。これらをパッケージとして送ることができます。ひとつひとつのスライドは、イメージ、声によるオーディオ、テキストでできていてそれをパッケージとして送ることができます。アメリカに住んでいるたくさんの友人は私のオランダ語のキャプションは役に立たないかもしれません。聞くことができても、オランダ語を理解することができないので、聞こえないということと同じです。そのような場合には、別個の英語のキャプションを同じスライドのパッケージに入れます。そして、それぞれの人にとって適切な情報を受け取ることができます。SMILという言語はそれぞれのメディアを結合させ、プレゼンテーションをフレキシブルな形でそれぞれの人のニーズにあわせて提供することができます。このことは取るに足りないと思う方もいらっしゃるかもしれません。ウィンドウズのメディアプレイヤーでできないことで、クイックタイムでもできなくて、普通のオーディオテープではできなくて、日本の一番良いビデオカメラでもできなくて、従ってSMILプレイヤーは、いろいろとカスタマイズすることができて、世界の国々では助けてくれる人々がいなければこのようなことをすることができません。

アクセシビリティの視点からSMILを見ると、SMILのコミュニティでもよく知られていないことですが、SMILがこのように構築されているひとつの理由は、選択性と結合させる能力です。このことはアクセシビリティにとって非常に良いことで、高速ネットワーク接続、低速度ネットワーク接続に関わらず、またはカラーモニターや腕時計の小さな白黒のモニターでも等しく情報を得て、情報を提供しているリソースを加工することができます。約20年前、ジャックと私がSMILの言語に着手し始めた頃、アクセシビリティが最大の関心事でした。DAISYに何故SMILが必要なのか不思議に思っておられる方々にとっては、マークさんが後ほど話をすると思いますが、DAISYは電子図書として非常に優れています。私は休暇には、DAISY図書を持って出かけます。私が運転をしている間、子どもたちは録音図書を聞いており、私も一緒に聞くことができます。運転をしている時は道路を見るべきなので、他のものを見ることができません。車の中ではオーディオ図書としてDAISYプレイヤーをオーディオブックを聞くために使っています。しかしながら、私たちの文化においては情報の多くはテキストになっているわけではありません。多くの情報はビデオやオーディオがベースになっています。合理的で、責任ある方法で様々なメディアを統合させる能力はSMILの大変重要な特徴です。DAISYを利用している方々のコミュニティにとっては非常に良い特徴であります。またもうひとつ良いことは、SMILはいろいろなプレイヤーに利用されているということです。ソニーのカメラ、個人向けカメラ、ポケットPC、MP3、ノキアの電話、ノキアは170万台のSMILプレイヤーを電話に取り付ける予定です。そしてそれを売る計画をたてています。ということは、ものすごい数の人がポケットの中にプレイヤーを持っているということになります。日本政府は寛容にも、必要としている人たちには誰でも無償でDAISYプレイヤーを提供しています。

SMILが非常に重要なことは、アクセシビリティをサポートする機能は特別なものではありません。それは、特別な目的をもったものではありません。コンテンツメーカーが使わなくてはならない特別な言語ではありません。重要なことは、コンテンツメーカーの言い訳が通らないということです。「もっとアクセシブルにしたかったが、ウィンドウズのメディアプレイヤーのせいでできなかった。」などという言い訳はできません。あとでお話しを伺いますが、LimSee2などを使えば誰でもアクセシブルなコンテンツをSMILプレイヤーのために製作することができます。そしてそれは、オープンソースで入手可能なソフトウェアで製作することができます。それはとても重要なことです。それによりSMILによるプレゼンテーションは何か特別なものを買わなくても、特別なユーザーのニーズを満たすことができるのです。主流のプロジェクトやプロダクトでできるわけです。

SMILプレゼンテーションがどんなものであるか、どのような構造なのかをご説明し、後ほど、少しデモンストレーションをしてみたいと思います。教育の分野からの一例をご紹介します。アメリカのMIT(マサチューセッツ工科大学)にある有名な物理の先生がいますが、彼は物理力学を教えています。そのコースの全体的な概念はとても良い試みです。というのは、JRの電車に乗っているとき、ボールを上に投げると電車は前に進んでいるのでボールは後ろの地点に落ちると考えられますが、実際には電車と一緒に動きながらその場所に落ちてくるわけです。これはとても良い例です。このビデオには、ビジュアルなものが含まれていて、誰もが画像を見ていると仮定し、彼は全てを説明しているわけではなく、このプレゼンテーションはビデオから始まっています。私は今からプレイヤーのプレゼンテーションをお見せします。ビデオの部分は丸で囲んであります。ビデオとは別にオーディオキャプションを作りました。キャプションはユーザーが見たいと思えば出すことができます。見たくない場合は出さなくてもよいのです。

日本語版を誰かが作れば、英語の代わりに日本語を出すこともできます。オランダ語や他の主要言語でも同じようにできます。また、もうひとつのオーディオがあります。それはビデオに写っている本人の肉声です。ボールがどのように落ちるのかを説明した絵がでてきます。ビデオをフリーズしておいても、次の音声が聞こえてきます。そして視覚障害者がわかるように、「先生は白い紙に下に線を描き、それはパラボラ形で上がカーブしており、数式がその上に書いてあります」というオーディオを入れることができます。ビデオが止まっていても全ての情報を提供することができるのです。視覚障害者は何が今スクリーンに映っているのか理解できます。視覚障害者にとってはそのように追加的に情報を提供することができますし、視覚障害者でない場合は、特別の情報はなしで見ることができます。どんな人でもプレゼンテーションで今何をやっているのか知識を共有できるとても強力な方法となります。追加的な説明を止めると、ビデオは先に進みます。もしご興味がある方には後ほどこのプレゼンテーションをお見せいたします。

SMILの良いところは独占的ではないということです。一社が所有しているのではなく、DAISYコンソーシアムなど興味のある団体は標準化のプロセスに共同で加わることができ、DAISYにとって重要なことを遂行できるように標準化作業に影響力を持つことができます。DAISYコンソーシアムが標準化団体にプレッシャーをかけていくことは重要です。また、SMILの良い点の別の側面ですが、使用料がかからないということです。また、オープン・スタンダード・プロセスであるということです。技術的な観点からは、いろいろなキャプションを入れることができるということです。

先ほども述べましたが、とても重要なことなのでもう一度言いますが、様々なコンポーネントは英語では”Bake in”と言いますが、プレゼンテーションの中に組み込まれてはいません。それはどういう事かと言うと、BBCやCNNからニュースのプレゼンテーションをとってきても、ユーザーは必要があれば常にキャプションを追加することができます。耳が聞こえないお子さんや全盲のお子さんがいらっしゃる場合には、コンテンツをとって、ご家庭で情報を追加的することができます。そうすることにより、より豊かなコンテンツでプロジェクトを見ることがでます。

SMILにはたくさんの技術的な側面があります。SMILについて学ぶことのできるリソースがたくさんあります。私がご推薦したい本があります。より多くの情報が知りたいと思われるなら後ほど私に声をかけて下さい。

次に、急いでAmbulant SMILプレイヤーについてお話します。Ambulant SMILプレイヤーはオープンソースのSMILプレイヤーです。オープン言語で、誰でもインストールでき、応用することができます。大変ユニークなことは言語を完全にサポートしており、フレキシブルなプレイヤー構造を持っています。このプレイヤーの利点は、とても早く完全に言語をカバーし、そのことは低速度のローパワーの装置でも使えることを意味し、またDAISYコンソーシアムのメンバーのような人々がカスタマイズでき、商業的な利益を追求しておりません。プレイヤーは、オープンなエンジン、そして特別な目的を満たすインターフェースから成る構造を持っております。DAISYのデバイス、またポケットPCであれば電話用の特別なボタンをつけることができ、メディアをサポートします。現在DAISYプレイヤーはビデオ機能が必要ではありませんが、言語やニーズが拡大すれば機能をつけることができます。現在は、マッキントシュ、Linux、ウィンドウズ、ポケットPCといったプラットフォームにもサポートされております。もしご興味がおありなら、www.ambulantplayer.orgに掲載されておりますのでご覧下さい。直接お問い合わせになりたい場合は、どうぞ私にご連絡下さい。
ご清聴ありがとうございました。