アカウント名:
パスワード:
辞書を使うということは、パスワードはとりあえず大丈夫ということでしょうか。日本語も当面は難しそうな気もしますが、漢字変換キーが定期的に押されるのでヒントにはなるのかな?
精度は低くなるけどパスワードの絞込み程度には問題なく使えるかもしれませんよ。
元記事見る限り、この手法は文字のbi-gram(2連結モデル)+位置情報+58000単語の辞書で認識しているみたいです。"bi-gram(2連結モデル)+位置情報"が音響モデル、辞書が言語モデルとしたら、音声認識と同じようなものですので、そっちで使っている各種ノウハウが形を変えれば結構使えそうです。(HMMとか使って無いだろうなあ・・そこまでちゃんと読んでないけど)
音声認識とかだと辞書なしでもある程度の絞込みはできます。(i.e. 辞書なしないし接続制約のみの連続音素認識)最初に辞書なしで候補を絞り込んで後は総当りとか、辞書のほうも2,3文字の連結モデルとかつかえば、結構正解にあたっちゃうんじゃないかな?
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
あつくて寝られない時はhackしろ! 386BSD(98)はそうやってつくられましたよ? -- あるハッカー
ターゲットは文面そのもの?? (スコア:0)
辞書を使うということは、パスワードはとりあえず大丈夫ということでしょうか。
日本語も当面は難しそうな気もしますが、漢字変換キーが定期的に押されるのでヒントにはなるのかな?
Re:ターゲットは文面そのもの?? (スコア:1)
精度は低くなるけどパスワードの絞込み程度には問題なく使えるかもしれませんよ。
元記事見る限り、この手法は文字のbi-gram(2連結モデル)+位置情報+58000単語の辞書で認識しているみたいです。
"bi-gram(2連結モデル)+位置情報"が音響モデル、辞書が言語モデルとしたら、音声認識と同じようなものですので、そっちで使っている各種ノウハウが形を変えれば結構使えそうです。(HMMとか使って無いだろうなあ・・そこまでちゃんと読んでないけど)
音声認識とかだと辞書なしでもある程度の絞込みはできます。(i.e. 辞書なしないし接続制約のみの連続音素認識)
最初に辞書なしで候補を絞り込んで後は総当りとか、辞書のほうも2,3文字の連結モデルとかつかえば、結構正解にあたっちゃうんじゃないかな?