動画のバリアフリー化のイメージ画像

動画をレベルAAAにする

この記事は nishimotz が過去に仕事で作った資料を整理したものです。

案件として経験したので、もっと知見が広まることを願って書いてみました。実装者だけでなく対応を要望したい人にも WCAG(Web Content Accessibility Guidelines)を知っていただければ幸いです。なお、この記事は アクセシビリティ Advent Calendar 2024 に参加しています。

個人およびシュアルタとしての見解であることをお断りしておきます。

手話動画から

手話ユーザーを対象として動画を提供するサイトにおいて、以下の要件が加わりました。

  • 視聴覚の重複障害者にも対応する
  • JIS X 8341-3:2016 レベルAA 準拠

WCAG に基づいて、特に動画の提供方法を検討します。

この記事では以下の場合に限定し、達成基準の名前で(収録済)を省く場合があります。

  • 収録済
  • 音声と映像を含む

結論として以下を提案しました:

  1. 手話ユーザーへの対応:達成基準 1.2.6(手話:レベルAAA)
    動画に手話通訳を含める。
  2. より幅広い聴覚障害者への対応:達成基準 1.2.2 (キャプション:レベルA)
    動画にキャプションを含める。
  3. 視覚障害者への対応:達成基準 1.2.7(拡張音声解説:レベルAAA)
    動画内のすべての情報を音声で解説した別バージョンの動画を提供する。
  4. 視聴覚の重複障害者への対応:達成基準 1.2.8(メディアに対する代替:レベルAAA)
    動画内のすべての情報をテキスト形式で提供する。

これは動画についてレベルAAAの達成基準をカバーするという目標になります。ウェブサイトがレベルAA準拠レベルAAA一部準拠を目指すこともできます。

以下では達成基準を読み解きます。なお WCAG 2.0 は JIS X 8341-3:2016 に対応しており、一方で WCAG の最新は WCAG 2.2 です。これらは、動画については達成基準の違いはありません。関連文書は主に 2.1 の日本語訳にリンクします。

時間依存メディアのガイドライン

ガイドライン 1.2 は「時間依存メディアには代替コンテンツを提供する」です。

達成基準には詳しいことが書かれておらず、解説書には場合分けがたくさんあって難解に感じます。

時間依存メディアの種類と分類を理解します。

メディアの種類

以下の種類があります:

  1. 音声しか含まない:例)ポッドキャストや音声メッセージ。
  2. 映像しか含まない:例)スライドショーやミュート動画。
  3. 音声と映像を含む:例)通常の動画や映画。
  4. インタラクションを組み合わせた音声と映像、又は音声あるいは映像のどちらかを含む:例)インタラクティブなビデオプレゼンテーションや教育用コンテンツ。

メディアの分類

以下の分類があります:

  • 収録済:事前に制作されたメディア。例)オンデマンド動画、事前収録の音声。
  • ライブ:リアルタイムで配信されるメディア。例)オンライン会議、ライブストリーミング。

達成基準の関係

音声と映像を含む収録済メディアには以下の達成基準があります。

  • 1.2.2 キャプション (レベルA)
    音声を含む動画コンテンツにキャプションを提供することで、聴覚障害者が内容を理解できるようにします。
  • 1.2.3 音声解説、又はメディアに対する代替 (レベルA)
    映像に重要な情報が含まれる場合、その情報を補完する音声解説または代替手段を提供します。
  • 1.2.5 音声解説 (レベルAA)
    視覚的な情報が重要な場合、標準の音声解説を提供して内容を理解しやすくします。
  • 1.2.6 手話 (レベルAAA)
    聴覚障害者向けに、手話通訳を動画に追加します。
  • 1.2.7 拡張音声解説 (レベルAAA)
    通常の音声解説では不十分な場合、拡張版の音声解説を提供して、すべての重要な情報をカバーします。
  • 1.2.8 メディアに対する代替 (レベルAAA)
    メディア全体の内容を完全にカバーするテキストによる代替手段を提供します。

後述する説明の内容をまとめました。左側がレベルAAAで右側がレベルAです。達成基準に付記した (*) の表記は、その列のレベルAAA対応によって満たせることを示します。

概要AAAAAA
キャプション1.2.2
手話1.2.6
拡張音声解説1.2.71.2.5 (*)1.2.3 (*)
テキスト1.2.81.2.3 (*)

手話

達成基準 1.2.6 手話 (収録済) (レベルAAA) の達成方法を理解しておきます。

達成基準 1.2.6: 手話(収録済)を理解する の「十分な達成方法」に以下があります。

G54: 映像ストリームに手話通訳を含める

  1. 目的
    耳が聞こえない、またはテキストを速く読むことが困難な利用者が、同期したメディアの情報にアクセスできるようにします。
  2. 理由
    • キャプションの速度が速い場合、テキストを読んで理解するのが難しい、または不可能な場合があります。
    • 手話を提供することで、キャプションだけではカバーできないユーザーのニーズを満たすことができます。
  3. 手話通訳を映像ストリームに含める方法
    一般的な方法として、ワイプ形式で手話通訳の映像を動画の一部(通常は画面の右下など)に表示することが挙げられます。この形式では、視覚的にわかりやすく、キャプションと手話通訳の両方を同時に提供することが可能です。
  4. 注意点
    • 映像ストリームのサイズが小さい場合、ワイプの手話通訳が認識できなくなることがあります。そのため、適切な表示サイズを確保する必要があります。
    • 手話通訳が視認しやすいように、動画をフルスクリーン再生できる機能を提供するとよいでしょう。

検証

G54の検証は、聴者で手話が理解できる人が行う必要があります。

手順

  1. 耳が聞こえて、使用されている手話に精通した人に映像を見せる。
  2. 手話通訳が画面上に表示されているかどうかを確認する。
  3. 会話および重要な音が、画面上の手話通訳によって正しく伝達されていることを確認する。

期待される結果

  • 2. および 3. の結果が真である

これが確認できれば、1.2.6 手話 (収録済) (レベルAAA) は合格と判断できます。

ですが、これだけでは、アクセシブルな動画とは言えません。

あらためて、レベルAから順番に、達成基準を見ていきます。

レベルA

音声と映像を含む収録済メディアの達成基準(レベルA)には以下があります:

  • 1.2.2 キャプション (レベルA)
  • 1.2.3 音声解説、又はメディアに対する代替 (レベルA)

1.2.2 キャプション(収録済) (レベル A)

聴覚障害者対応の要件です。

達成基準 1.2.2: キャプション (収録済) を理解する

同期したメディアに含まれているすべての収録済の音声コンテンツに対して、キャプションを提供します。提供方法は以下の2種類のどちらでもOKです。

失敗例

1.2.3 音声解説/メディアに対する代替(レベル A)

視覚障害者対応の要件です。

達成基準 1.2.3: 音声解説、又はメディアに対する代替 (収録済) を理解する

要件

映像コンテンツに対して、代替コンテンツまたは音声解説が提供されていることが求められます。

選択肢

  • 音声解説 → 1.2.5(レベル AA)
    音声解説を追加することで、視覚的な情報を補完し、アクセシビリティを向上させます。
  • 完全なテキストによる代替 → 1.2.8(レベル AAA)
    映像コンテンツの内容を完全にテキストで代替することで、より高いアクセシビリティ基準を達成します。
  • 映像トラックに含まれるすべての情報が音声トラックですでに提供されている場合、音声解説を追加する必要はありません。

このどれかにあてはまればOKです。1.2.5 と 1.2.8 はこの後で説明します。

ここまでレベルAの達成基準を紹介しました。

レベルAA

レベルAAの達成基準で追加されるのはひとつです。

  • 1.2.5 音声解説(レベル AA)

レベルAでは、1.2.3 音声解説/メディアに対する代替 において、複数の選択肢がありました。しかし、レベルAAでは 1.2.5 音声解説 が必須です。

言い換えると、達成基準 1.2.5 に対応すれば 1.2.3 は達成できたことになるわけです。

それでいいかどうかは 1.2.5 を理解して判断しましょう。

1.2.5 音声解説 (レベル AA)

同期したメディアに含まれているすべての収録済の映像コンテンツに対して、音声解説をつけることにより、全盲または視覚障害のある利用者に対して情報を効果的に提供できます。

達成基準 1.2.5: 音声解説 (収録済) を理解する

映像の代替コンテンツとしてのテキストは「音声解説」になりますか? (ウェブアクセシビリティ基盤委員会 Q&A)

提供方法

会話の切れ目の間に、以下の情報を音声解説として追加します:

  • 動き:画面上での動作や動きに関する説明。
  • 登場人物:登場人物の動きや表情の変化に関する情報。
  • シーンの変化:シーン転換や場所の変更に関する説明。
  • 画面上の文字:画面上に表示される文字やテキストに関する情報。

これらは、重要かつ主音声では説明または話されていない内容に限ります。

注記

  • 映像トラックに含まれるすべての情報が音声トラックですでに提供されている場合、音声解説を追加する必要はありません。

達成方法

音声と映像を含む場合に限定するので、例えば G203 は除外しています。

G78 音声解説を含んだ、利用者が選択可能な副音声トラックを提供する

  • 副音声トラックを利用して音声解説を提供します。テレビ放送や映画の音声ガイドに相当します。

G8 拡張音声解説が付いたムービーを提供する

  • 拡張音声解説がついたバージョンを提供し、これにより 1.2.7 拡張音声解説 (レベル AAA) を達成します。

1.2.5 を達成する方法のひとつとして 1.2.7 (AAA) が出てきました。レベルAAは他にないので、次に進みます。

レベルAAA

レベルAAAの手話以外の達成基準を見ましょう。

  • 1.2.7 拡張音声解説 (レベル AAA)
    拡張音声解説が付いた動画を提供します。
  • 1.2.8 メディアに対する代替 (レベル AAA)
    メディア全体に対する完全な代替手段を提供します。

1.2.7 拡張音声解説 (レベル AAA)

達成基準 1.2.7: 拡張音声解説 (収録済) を理解する

音声解説は、元の音声がないところ(前景音の合間)に入れます。ですが、コンテンツによっては、音声解説を入れられる場所が足りなくて、映像の意味を十分に伝達できなくなります。

この場合、拡張音声解説により、視覚障害者が映像の内容をより深く理解できるようにします。

拡張音声解説と音声解説の違い (ウェブアクセシビリティ基盤委員会 Q&A)

前述の「1.2.7 を理解する」のページにはこんな事例があります。

事例

講義の映像。 物理学の教授が講義をしている。教授は、ホワイトボードに手書きで図を描きながら、早口で話している。一つの問題を解説し終えると、教授はすぐにその図を消して、別の図を描きながらもう片方の手で身振りを交えながら話し続けている。

映像は、問題と問題の間で一時停止し、教授の描いた図と身振りを説明する拡張した音声解説を提供している。

そして、映像の再生が再開される。

ポイント

  • 詳細な説明の追加
    教授の身振りや図の描写に関する詳細な情報を音声で補足します。
  • 一時停止と再開
    拡張音声解説を提供する際に映像を一時停止し、必要な情報を集中して伝えます。

テレビ放送や映画には拡張音声解説はありません。 YouTube で「拡張音声解説」を検索すると事例が見つかります。

1.2.7 をカバーすると、別途 1.2.5 (AA) の音声解説を提供する必要がなくなります。

1.2.8 メディアに対する代替 (レベル AAA)

達成基準 1.2.8: メディアに対する代替 (収録済) を理解する

動画の情報をすべてテキスト形式で提供します。以下の達成方法が挙げられています。

1.2.8 メディアに対する代替 (レベル AAA) をカバーすれば、1.2.3 音声解説/メディアに対する代替 (レベル A) を満たします。

冒頭で「視聴覚の重複障害者にも対応する」と書きました。実際には「すこしだけ見える」「すこしだけ聞こえる」といった状況もあり、人それぞれです。

レベルAAAは以下のようにカバーします:

  • 点字ユーザーは、点字ディスプレイで代替コンテンツを読む
  • 聞こえ方の程度によっては、拡張音声解説を聞く、あるいは代替テキストを読み上げる
  • 見え方の程度によっては、キャプションを見る、あるいは代替テキストを拡大する

これを部分的にカバーすることがレベルAだったわけです。

写真 点字ディスプレイ

全体の補足

「音声と映像を含む場合」を考えたので、例えば達成基準 1.2.1 は WAIC の 試験実施ガイドライン に従うと、こうなります:

  • 試験対象に含まれない
  • 試験結果が「適用:なし」になる

このような達成基準は、この記事では省略しました。

拡張音声解説とメディアに対する代替(テキスト形式での提供)は、どちらも作成にコストがかかりますが、準備の段階で、同じように原稿を作ることになり、共通化できる作業があります。

達成基準 1.2.5 のための音声解説を作り、副音声に対応した動画プレイヤーを実装すればレベルAA。

準備作業を共通化して拡張音声解説とテキストを提供すればレベルAAA。

レベルAAAのコストが高い、と単純には言えないと思います。

そこで「動画に関してはAAAの達成基準をカバーする」という提案をしました。

実際には複数の動画や代替コンテンツがあるため、これらの切り替えやナビゲーションを実装する必要があります。切り替えの操作やコンテンツの内容においてもウェブアクセシビリティが重要です。

それから、達成基準の相互関係は WCAG や JIS そのものでは言及されていません。この記事では「達成方法集」に基づいて私が判断しました。達成方法の選び方によっては判断が異なるかも知れません。

レベルではなくニーズを起点に

ウェブアクセシビリティ対応において、WCAGレベルAAAの達成基準は検討されないことが多いと思います。

デジタル庁のウェブアクセシビリティ導入ガイドブックにも「音声・映像コンテンツに代替コンテンツを付与する」と書かれていますが、レベルAAAの達成基準は紹介されていません。

本当はウェブアクセシビリティと関係のあるニーズが「レベルAAAだから」という理由で排除されているとしたら、残念なことです。

具体的なニーズ(この記事では手話ユーザーへの対応)を仕様に落とし込むときに、WCAG が要件であるかどうかに関わらず、以下のように取り組めると思います。

  • WCAGやその関連文書を、ユーザーのニーズを起点に理解し、実装のためのリソースとして活用する
  • レベルAAAの達成基準も部分的な検討の対象にする
  • レベルAAをカバーしつつ、レベルAAAをうまく取り込んで、より高いレベルのアクセシビリティを確保する

機会があれば、例えば高齢者対応についても、同じように考えてみたいと思っています。

この a11y.shuaruta は NVDA 日本語版をシュアルタの事業として紹介するサイトですが、こういう記事も書いていこうと思います。