「無人島」が読めない

単語辞書に含まれていないため、「無人島」が読めていない。現在は、「ムジンジマ」と読みます。すごく変です。

どうも現状では、三文字単語で含まれていない単語が多い。「無人+島」と分けて管理するポリシーっぽいが、「島」を読み分ける必要がある音声合成の分野では、ちょっとどうかなと思う。そういえば、「自動車」の単語も含まれていなかったと思う。

例えば、ipadic-2.7.0 には、「無人島」という単語が含まれているので、根本的にちょっと見直すことにしようと思います。

そういえば、「島」の「シマ」「ジマ」「トー」の読み分けは、NHKアクセント辞典の付録に載っていた分は、登録しています。例えば、淡路島、能古島、屋久島は濁らず「シマ」と読み、グアム島、ハワイ島、利尻島などの外国や北海道の島の名前は「トー」と読み、その他は「ジマ」と読みます。

そういえば、カタカナ未知語に付く場合は、「トー」と読む処理は、必要だろうと思ってはいましたが、まだ対応できていません。「町」の「マチ」と「チョー」の読み分けも、まだ対応出来ていません。分かってはいますが、まだまだ先は長いです。