音声ブラウザご使用の方向け: ナビメニューを飛ばして本文へ ナビメニューへ

DAISYコンソーシアムマルチメディア・リサーチ・プロジェクト

DAISYコンソーシアム(ジョージ・カーシャー、マーク・ハッキネン)

項目 内容
発表年月 2003年3月

目次

序論と目標

ストリーミングの主な手段

SMIL、アクセシビリティーを可能にする技術

障害者のための図書館で利用されているDAISY仕様

DAISYのストリーミングの方法

今後の目標

結論と勧告

参考文献

序論と目標

DAISYコンソーシアムは、2002年に日本障害者リハビリテーション協会と共同で、2003年3月いっぱいまで利用できる研究助成金を受け取った。この研究助成金は、障害者にとって非常に大きな可能性を持つものとしてマルチメディアをとらえつつも、障害者をユーザーの一部として、サービスを提供するターゲットに加えなければ、おそらくマルチメディア技術の発達において障害者にとってアクセスしにくいバリアーが生じてしまうであろうという危険性を認め、支給された。

研究の趣旨:

  • IT産業におけるマルチメディアの現状について、特にインターネットとストリーミングに注目し、研究する。
  • 主流のユーザーと同等の価値がある障害者にとって、最適なユニバーサルデザインのマルチメディア技術を確認する。
  • 国連に対し、障害者の情報へのアクセスに関する勧告を行う。
  • DAISYコンソーシアムに対し、勧告を行う。

ストリーミングの主な手段

マルチメディアのコンテンツのストリーミングは、1990年代半ばに大きく進展し始めた。ストリーミング技術における先駆者は、Real Networksで、これをApple ComputerとMicrosoftが追った。

Real Networksは、1995年にReal Audioというストリーミング・サーバー及びプレーヤーを発売した。この技術は、現在、複数の音声と動画のストリーミング・コーデックをサポートし、Windows、 Linux、 Macintoshなどの複数のクライアント/サーバー・プラットフォームで使われているRealOneへと発展している。最近、Real NetworksはHelix Initiativeを提唱し、同社の大部分のクライアントとサーバーの技術を、オープン・ソース・コミュニティーで利用できるようにすることを主張している。Helix版のReal Networksのサーバー・ソフト、コンテンツ作成ソフト、再生用クライアント・ソフトが利用できるが、これらの製品が真にオープン・ソースであるかどうかは明らかではない。なぜなら、Real NetworksはHelix製品の販売を続けているからである。Real Networksは現在、SMILのサポートと、複数の音声動画フォーマットの提供をしている。キャプションについては、同社のRealTextのフォーマットによってサポートされている。

AppleのQuickTimeは人気のあるストリーミング・フォーマットで、複数のプラットフォームで利用することができる。もともと1991年に開発されたQuickTimeだが、1999年までは効果的なストリーミング技術が開発されることがなかった。現在QuickTimeにはMPEG4とSMILのサポートが組み込まれている。キャプションはAppleのQtextフォーマットによってサポートされている。

Microsoftは、1991年以来、ローカル・メディア・ファイルの再生装置を提供してきたが、ストリーミングは1999年10月まで提供していなかった。今日、Microsoftは、Windows Media Playerを、オペレーティング・システムの各バージョンとセットで販売しており、これには音声と動画のストリーミングがついている。同社は、複数の音声と画像のフォーマットをサポートしているが、現在SMILのサポートはしていない。(しかし最近のWindows Media Player 9の説明書では、SMILが再生リストの作成に使われていると記されている。)キャプションはSAMIフォーマットによってサポートされている。

市場でのシェアの点では、アメリカ合衆国からの最近のデータ(http://www.creativepro.com/story/news/12636.html)によれば、Real Networks(ユーザー数2590万人)がMicrosoft(ユーザー数2150万人)をわずかに上回り、Apple(ユーザー数790万人)を大きく引き離している。

この他にも、IceCast(www.icecast.org)のようなストリーミング技術も存在する。IceCastは、オープン・ソース、またオープン・スタンダード・プロジェクトとして制作されており、MPEGとOgg Vorbisのストリーミングをサポートしている。

Mplayerは、Linux用のオープン・ソースのメディア再生ソフト(www.mplayer.hu)で、複数の音声・動画フォーマットをサポートし、独自のサブタイトル/キャプション・フォーマットを組み込んでいる。

OpenMash(http://www.openmash.org)は、分散型共同作業とマルチメディア・アプリケーションのストリーミングを研究するための、マルチプラットフォームかつポータブルなパブリック・ドメイン・ツール・キットである。

もう一つの、Macromedia Flashという技術についても、マルチメディア・ストリーミング・システムとして考えることができるであろう。Flash(及びそれに関連したフォーマットであるShockwave)は、マルチメディア制作及びプレゼンテーション・システムで、独自の言語とランタイム・モジュールを使っている。クライアントは、Flashの再生ソフトをPDAを含むほとんどの一般的なプラットフォームで利用できる。Flashは、スライドショーのような簡単なものから、書式に記入する様な完全な対話型アプリケーションのような複雑なものに至るまで、あらゆるマルチメディア・プレゼンテーションを作成するのに使うことができるため、従来のマルチメディア・ストリーミング製品とは多少違った部類に入る。Flashにアクセシビリティーがないことは広く認められており、Macromediaは、スクリーン・リーダーとの互換性を持たせるなど、アクセシビリティーに関する機能を盛り込むよう、この問題に対処し始めた。しかし、システムが独自仕様で、オープン・スタンダードに基づいていないという事実は、重大な問題として残っている。

SMIL、アクセシビリティーを可能にする技術

SMIL (Synchronized Multimedia Integration Language)バージョン1は、1998年、W3Cの勧告仕様となった。この仕様の開発には障害者支援活動に関わる人々が参加し、WAIはアクセシビリティーを再検討した。SMIL2の開発では、言語のアクセシビリティーの開発が続けられた。また、業界においてSMILはより広く受け入れられ始めた。SMILは、マルチメディアの分野において主導的な役割を果たしている技術のひとつであり、オープンかつ非独自仕様で、アクセシビリティーが証明されている点で、明らかに重要な仕様であるといえる。

障害者のための図書館で利用されているDAISY仕様

1998年、DAISYコンソーシアムは、SMILバージョン1を利用する仕様開発に方向変換した。DAISYコンソーシアムによる現在の勧告仕様は、DAISY2.02で、これではSMIL1とXHTMLが使われている。最近ではこの仕様の開発はすべてSMIL2とXHTMLに基づいて行われている。DAISY3の仕様開発は、NISO(National Information Standards Organization)によって行われており、この仕様は、アメリカ合衆国の公式な勧告仕様として、ANSI/NISO Z39.86-2002という名称で認められている。これを国際標準化機構(ISO)に提案するかどうかが議論されている。

DAISY標準規格を世界的に採用し、実施するよう示すことが最も重要である。これはSMILに基づいて開発された中核となる技術で、これを利用することで、我々は更にマルチメディアへのサポートを進めていくことができるのである。

DAISYのストリーミングの方法

2003年初期の時点で、2つのグループが、独自に開発したクライアント/サーバー型の設定を利用したDAISYのストリーミングを実際に行っている。サーバー上のDAISYのコンテンツが変更されていないかどうかは明らかではない。DAISYのストリーミングの方法を、以下に簡単に説明する。

Phoneticom(スウェーデン、ストックホルム)
Phoneticomの技術では、サーバーからストリーミングしたDAISYのコンテンツを読みとるためのクライアントとして、DolphineのSTAR/EaseReaderの技術を使っていると思われる。
Plextor
Plextorの方法では、サーバーから音声ファイルを検索するために、おそらくFTPスタイルのプロトコルを使ったカスタム・クライアントを利用している。

どちらの方法を使っても、一時停止/再起動や構造的なナビゲーション等の、標準的なDAISYスタイルのユーザー・インターフェースの機能を提供できると思われる。

DAISYのストリーミング用の、オープン・スタンダードなプロトコルを利用したオープン・ソースな手段は、現時点では無いことを指摘しておかなければならない。更に、現段階では、どのような形式であれ、相互操作が可能な方法は無いことも述べておく。

今後の目標

タイムド・テキスト(Timed Text)

W3C SMIL標準規格はアクセシブルなマルチメディア・プレゼンテーションの制作を助けるために作られたが、キャプションや字幕を入れるための標準的な方法を提供していなかった。その結果、現在、互換性のない3つの主要なキャプション作成フォーマットができてしまった。これが、Real NetworksのRealTextと、MicrosoftのSAMI、そしてAppleのQtextである。2002年に、W3Cが中心になり、Timed Textという、共通のキャプション作成及び互換フォーマットが制作された。この新しいフォーマットは、キャプションに関して統一された解決策を提供するだけでなく、DAISYによる出版物の中で単語や音節のレベルで強調表示するための、標準的で効果的なマークアップ言語も提供している。DAISYコンソーシアムの会員は、タイムド・テキスト作業グループに参加している。

DAISYのナビゲーション

DAISYに組み込まれているナビゲーション・モデルは、ローカル配信、或いはストリーミングによって配信されたマルチメディアの利用性を高めるという重要な可能性を提供する。構造的なナビゲーションを、緊急時に備えた、アクセシブルなマルチメディアによる情報作成にどのように利用することができるかを実演しようという提案が、既に出されている。更に、DAISY形式のやりとりの方法を、モバイル機器に配信されるマルチメディアのストリーミングに適用することは、多様なインターフェースの開発にとっても意義があることと思われる。マルチメディア・プレゼンテーション、中でも特に入力機能が限られていてディスプレイが小さい機器において、使いやすいナビゲーション及びオリエンテーションが利用性を高める役割を果たすことは明らかである。

W3C VoiceXML2.0勧告仕様において定義されたVoice Browsingは、DAISYナビゲーション・モデルをVoiceXMLダイアログに変換し、DAISYのコンテンツを、電話を通じて配信する手段として説明されている。この方法は、声による指示を通して、構造的なマルチメディアの中でのナビゲーションとオリエンテーションを可能にするものである。

DAISYへの映像の追加

DAISY標準規格の背景にある、オープン・スタンダードに基づいたアプローチの結果、近い将来、動画を含むマルチメディアにおけるDAISYコンテンツの研究と試作品の制作が始まる可能性が考えられる。AMISのような現在のDAISYプロジェクトは、映像をサポートするよう企画されており、業界の標準的なメディア再生技術を使って、アクセシブルなマルチメディア・ストリーミングに関する研究を行う場として役立っている。ストリーミングされたマルチメディアをアクセシブルなものにするために、共通かつ相互操作性のある標準規格の設定を確実に行うには、関連する標準規格設定団体や、研究者、コンテンツ制作者及びユーザーの協力が必要である。

MPEGとアクセシビリティー

あらゆるタイプのコンテンツを配信することは、MPEGの活動の中心となる主要な分野である。MPEGが仕様の開発においてアクセシビリティーを考慮するのは非常に重要である。しかし、MPEGのリーダーとの会話から、W3Cで認められている障害に関わる専門的な技術は、MPEGでは利用できないことが明らかになっている。

DAISYコンソーシアムはMPEGとともに活動をする道を模索した。この問題について検討している際、DAISYコンソーシアムがMPEGと正式な提携関係を結ぶことが提案された。この動きは先に進められ、2つの機関の間に正式な協力関係が結ばれた。

DAISYコンソーシアム内の専門家はMPEGに対し、アクセシビリティーの問題に関するガイダンスを提供できると思われた。しかし、MPEGのプロセスの達成には、膨大な時間と行程を費やさなくてはならず、このことがDAISYコンソーシアムの中で大きな問題となっている。

情報コミュニケーション技術(ICT)専門家会議

この助成金からの資金を、DAISYコンソーシアムは、2002年6月20日から22日までバンコクで開かれた会議に数人の専門家を派遣するための旅費にあてた。専門家は一連の勧告を作成し国連に提出した。更に、DAISYの技術が、3日間の会議期間中、展示された。

6月20、21、22日に、アジア太平洋地域の障害者のためのICTセミナーが開かれた。約20人の専門家のリソース・パーソンが初日の会議に招待された。この初日に、専門家たちは国連に提出するため、アジア太平洋地域を対象にした勧告のリストを作成した。この勧告の中では、DAISYとWAIの技術が特に重視された。

二日目のセミナーは国連会議室で行われたが、ここは大変印象的な場所で、河村宏氏を議長とし、Ingar Beckman-Hirshfelt氏、George Kerscher氏、Judy Brewer氏とITUから参加したKim氏らによるパネル・プレゼンテーションが行われた。午後には勧告が発表され、参加者からのコメントが集められた。その晩と翌日の会議では、コメントが勧告に盛り込まれ、最終的な原稿が提出された。アジア太平洋諸国は提言を検討中で、近い将来、正式な声明が発表されるものと期待される。

W3C WAI 研究開発グループ(RDIG)

W3CのWAI内で2002年後半、新たな活動が始まった。これは、ウェブの技術に関して始められた研究の中でアクセシビリティーの問題を検討することを目的とした活動である。Markku Hakkinen氏が委員長を務めるRDIGの任務は、教育界、産業界及び政府における、将来W3Cの勧告仕様や、ウェブ一般に影響を与えると思われる研究プロジェクトを確認することである。このような研究は、アクセシビリティーを早い段階で考慮することなく進められてしまうことが非常に多い。RDIGは、研究課題に基づいた一連のワークショップを、コンピューターネットワークを通じて行うことで、研究者・団体に連絡を取っている。各ワークショップでは一つの技術に焦点を当て、世界中から研究者を招いて、その業績を発表したり、アクセシビリティーに関する問題を調査したりする。目標は、研究者・団体とアクセシビリティーを進める団体との協力関係を促進し、アクセシビリティーの問題に対する意識を高め、ウェブ関係の研究にアクセシビリティーの要素を取り入れることである。

マルチメディアのアクセシビリティーは、RDIGが調査している多くの研究課題を通じて共通するテーマである。研究にアクセシビリティーを盛り込むよう求めることで、DAISYに利益がもたらされる機会も多い。例えば、DAISYの概念を更に広めることができるような新しい研究が認識されたり、DAISYの制作、普及そして利用を改善する技術的な解決方法の可能性、また、DAISY標準規格やDAISYの概念をこれまで考えられていなかった分野にも新しく採用する可能性が生まれたりする。

結論と勧告

この助成金による研究期間中、DAISYコンソーシアムは重要な計画を確認し、その実施へと前進していった。以下にあげるのは、勧告のリストである。

  • 情報へのアクセスが基本的な人権であるという概念を世界中に広める。このメッセージは、DAISYコンソーシアムから配信するメッセージの中にも盛り込む。この概念は、国連の内部でも推奨されてきたが、情報社会に関する世界サミット(WSIS)においても主張する予定である。
  • アクセシビリティーが備わっているという確かな記録を持つ、オープンで非独自仕様の標準規格の開発と採用を進める。これは、DAISYコンソーシアム、W3C及びOeBFの中で行われる。
  • SMILを基本的なマルチメディア技術として促進する。
  • W3CのTimedText作業グループの結成を支援したが、今後もこの開発に参加し続ける。これによって上記のマルチメディア技術が一つにまとめられるよう期待する。
  • DAISYとMPEGが正式な協力関係を結んだので、MPEGにアクセシビリティーを盛り込むよう協力する。これは勧告されたことではあるが、現時点ではどのように必要な材料をとりまとめて行くかはまだ明らかではない。
  • WSISのために、主流の人々と同じように障害者が利用できるよう、最適な形式、すなわち、DAISYによる情報を提供する。
  • DAISYのナビゲーション・モデルを標準規格に関するフォーラムに広く推奨する。DAISYのモデルは既にOeBFによって次のバージョンの仕様に採用されている。またXHTMLの将来のバージョンにも採用されつつある。
  • DAISY勧告仕様に映像も加える。
  • オープン・ソースのマルチメディア・ツールの開発を進める。

参考文献

技術:

標準規格に関する活動:

論文・プレゼンテーション・出版物:

  • M. DeMeglio、M. Hakkinenn、河村宏 Accessible Interface Design(アクセシブルなインターフェースのデザイン):Adaptive Multimedia Information System(AMIS)(適応性のあるマルチメディア情報システム) ICCHP 2002、リンツ (Springer Lecture Notes in Computer Science 「コンピューター科学のシュプリンガー講義ノート・シリーズ」)
  • S. Goose、S. Kodlahalli、W. Pechter、R. Hjelsvold Streaming Speech(ストリーミングに関する講演):A Framework for Generating and Streaming 3D Text-To-Speech and Audio Presentations to Wireless PDAs as Specified Using Extensions(エクステンションの利用により合成言語に変換された3Dテキスト及び音声プレゼンテーションをワイヤレスPDAへとストリーミングする構造)WWW2002、ホノルル
  • http://eprintsdemo.wwwconf.ecs.soton.ac.uk/archive/00000338/01/index.html
  • M. Hakkinen、M. DeMeglio、河村宏 gNCX:Structure-based Navigation to Enhance Usability of Digital Media(デジタル・メディアの利用性を高める、構造を基盤としたナビゲーション) ポスターによるプレゼンテーション WWW2002、 ホノルル
  • J. Hunter、V. Witana、M. Antoniades A Review of Video Streaming over the Internet(インターネット上の映像のストリーミングに関する考察)
  • http://archive.dstc.edu.au/RDU/staff/jane-hunter/video-streaming.html