日本語デジタルテキストのアクセシビリティと教育的な課題その２

昨日の続きです。
・音声読み上げの問題
ルビ振りにも関係することなのですがテキストのデータを読み上げる時に英語と違って日本語の場合には読み間違いが必ずおこります。
これは，日本語の同じ文字を別の読み方で読むことによります。たとえば「三田」を東京の人なら「みた」と読むでしょう。しかし，兵庫県の人ならば「さんだ」と読むかもしれません。人名や地名などは当て字とも考えられるような様々な読みをする可能性があります。
これについてマルチメディアDAISYなどでは録音音声を使うことによって回避しています。
また，初期のTTS（Text to Speech）は，日本語の読み上げ機能が低かったので，発音にも問題がありました。実際，私が使っているMacでは標準でテキスト読み上げの機能が付いており，ファイルをダウンロードすれば日本語の読み上げもできますが，英語の発音に比べると日本語の読み上げはいまいちです。
しかし，市販のテキスト読み上げソフトはとても機能が高くなり，発音もとても流暢になってきました。それでも，読み上げの間違いはおこります。
しかし，世の中のすべての書物に対して朗読音声が付いているわけではなく，TTSの技術が必要となります。そうした時に以下にして読み間違いをしないようにするかという研究もされてきています。
たとえば，EPUBなどでは正しく読み上げるためのタグをデータの中に埋め込ませて，読むということも研究されているそうです。
朗読音声でなくそうするのは時間や手間，ファイルサイズなどいくつかの課題をクリアできるからです。もちろん，朗読音声の良さもありますし，電子書籍の中で人の朗読が入っているものも多数売られています。
どちらにせよ日本語独特の読み間違いを回避することは大きな課題です。
また，ルビが付いている場合にもTTSだと本文とルビの両方を読んでしまう場合があり，これもデータやブラウザを上手く調整しなければならないでしょう。

・・・・・・・・・・・・・・・・・・・・・・・・・

雨が降ったり日が照ったり，なんかまだ夏ですね。

ブログの記事に興味を持っていただいた方，応援をしていただける方は

1日1回こちらをクリックしていただけませんか？→→
こちらもよろしく→