アカウント名:
パスワード:
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
未知のハックに一心不乱に取り組んだ結果、私は自然の法則を変えてしまった -- あるハッカー
コーパスって (スコア:0)
検索しても出てこないぞ
英語のコーパスはあると便利ですが‥‥ (スコア:2, 興味深い)
「・・・弁当を・・」という文章が主にヒットしました.
『的を』と入力してみた.『射る』が検索されることを期待した.
「・・・目的を・・」という文章が主にヒットしました.
『どんだけ』と入力してみた.(いえ,ちょっと昨今の使い方についていけなかったので.)
3件の結果がでましたが,役に立ちませんでした.
検索のシステムにも改良の余地はあるでしょうが,現時点ではgoogleで使い方を調べたい語句をクォーテーションで囲んで検索した方がよっぽど有用です.
Re:英語のコーパスはあると便利ですが‥‥ (スコア:2, 興味深い)
というかこういう単純なやり方で上手くいかないのが日本語を計算機で扱う上で問題となっていて、
何をするにもまず日本語は単語に分割する必要があります。
単語に分割する為にはまずどんな単語があるかを調べる必要があるのですが、
そこで今回のようなシステムが役に立ちます。
例えば「猫」で検索すると前後の文字がかなりバラバラになっているから「猫」で単語になりそうだとか、
逆に「索」で検索すると前の文字は殆ど「検」になってるから「索」は単語じゃ無さそうだけど
「検索」という単語がありそうだとかがわかります。
こんな感じの学習は前もって(100%正しいかどうか定かでない)単語に分割されてると難しいので、
とりあえず文字単位での全文検索で公開ってのは普通だと思いますよ。