アカウント名:
パスワード:
ここ [tabesugi.net]で紹介されていた本家の記事 [slashdot.org]で、英文の単語認識モデルについての最近の研究 (Microsoft Researchの人の論文 [microsoft.com]) が紹介されています。文字を読む時の脳の働きに関する、欧文側からのアプローチとしても興味深い所です。
個人的に面白かったのは、「文を読む時には単語全体の形を認識している」というタイポグラファの俗説は間違いだったという話です。この点に関しては、「ローマン体は上下を隠してもなんとか読める(ので、サンセリフは可読性で劣る)」という伝統的な考えのほうが正しかったようです。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲはアレゲ以上のなにものでもなさげ -- アレゲ研究家
単語認識の科学 (スコア:3, 参考になる)
ここ [tabesugi.net]で紹介されていた本家の記事 [slashdot.org]で、英文の単語認識モデルについての最近の研究 (Microsoft Researchの人の論文 [microsoft.com]) が紹介されています。文字を読む時の脳の働きに関する、欧文側からのアプローチとしても興味深い所です。
個人的に面白かったのは、「文を読む時には単語全体の形を認識している」というタイポグラファの俗説は間違いだったという話です。この点に関しては、「ローマン体は上下を隠してもなんとか読める(ので、サンセリフは可読性で劣る)」という伝統的な考えのほうが正しかったようです。
Re:単語認識の科学 (スコア:1)
斜め読みってどうやるんでしょうか?気になります。
# 英語を素早く読めるようになりたいので
Re:単語認識の科学 (スコア:0)
英語の場合は、ピリオドに続く広めの空白と大文字の前後の単語を読むと良いような気がします。
Re:単語認識の科学 (スコア:1)
そういえば奥村さんのTeX の本にピリオドの後のスペースは
少し広めに組むようになっている、とありました。
文の頭と尾をつかみやすいようになってるんですね。
組版は読みやすくすることが第一なのだから組版のルールを調べれば英語の
読み方についてのヒントも隠れているかもしれませんね。
Re:単語認識の科学 (スコア:1)
Re:単語認識の科学 (スコア:1)
単語“全体の形”ではなく、単語の“特徴形状”を認識していると考えれば間違いではないような気もします。例えば、文字をガウスブラーでぼかしたりノイズを加えたりしていっても、ある程度のところまでは読めますよね。
脳の中にこの特徴形状がパターン化されて記憶されているとすれば、一部隠されても読めるとか、読めるけど書けない字とか、見た目の似た単語を誤読してしまうといった現象も納得がいきます。
実際には、複数の方法を組み合わせて認識しているでしょうから、いろいろな認識の仕組みが出てきてもおかしくはないんじゃないでしょうか。
OCR方面でこの手の研究していそうな気もしますが、どうなんでしょう?
手書き文字を認識できるOCRとかに役立ちそう。