パスワードを忘れた? アカウント作成
660883 journal

aitoの日記: 9/25

日記 by aito
  • このペースだと日記でなく月記だね.
  • NICHeでハッチェリスクエア入居ヒアリング.部屋を借りるだけにしては えらく大げさな審査があるもんだ.
  • 雑用がせっぱつまってきたので本業に逃避する.というわけで,ランク言語モデル というのを考えてテスト.あるコンテキストの単語出現確率の対数とランクの対数を 最小2乗で直線近似して,それを正規化することによって確率を算出する.

    毎日新聞95年のデータでtrigramを作成し,96年の冒頭10000文で評価してみる.

    モデル PP
    --------------------------------
    オリジナル 65.2709
    ランク(case 1) 93.9116
    ランク(case 2) 72.2116
    case 2は最小2乗に単語の出現確率で重みをつけたもの.けっこういい線いってるかも.

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

人生unstable -- あるハッカー

読み込み中...