漢字の読み分け

漢字の読み分け処理を行わないと、まずい例を示します。

例えば「金星」(キンセー)。「金星の太陽面通過」のニュースが報道されていたのは、2012年6月6日でした。一方相撲では「キンボシ」と読みますし、相撲でなくても、「キンボシ」と言うこともあります。そこでどうするかというと、「天体、惑星、太陽、地球、観測、軌道、明星」あるいは「相撲、横綱、力士」という単語が近くにあるかどうかで読み分けるようにしています。「金」も、「キン」と読むか「カネ」と読むか、結構悩ましいものがあります。去年のオリンピックの、2012年7、8月頃には、「金メダル」を「カネメダル」と読んでいた時期もありますが、最近は多少改善されてきたと思います。

動詞の活用形に関して、野田首相退陣ニュースの関連記事で、「退路断った首相」「一般論だと断ったうえで」というのがありました。「断った」を「タッタ」(タ行五段「タツ」の連用形)と読むか、「コトワッタ」(ラ行五段「コトワル」の連用形)とどちらで読むかです。読み分け方法としては、動詞「断った」の左側に、「鎖、糸、 はらわた、悪、根、退路、路、補給、命、生命、筆、食、甘い」という単語が、近傍の3単語以内に存在すれば、「タッタ」と読み、それ以外は「コトワッタ」と読むようにしています。あと有名なところで、「行った」を「イッタ」(カ行五段「イク」の連用形)と読むか「オコナッタ」(ワ行五段「オコナウ」の連用形)がありますが、もう少し複雑な読み分け条件を使っています。