kubotaの日記: NAIST 2
日記 by
kubota
これから、茶筌 (ChaSen) で有名なNAISTまで日帰りで行ってきます。
そういや ChaSen ライセンス問題ってどうなったんだろう。せっかく mnoGoSearch から使えるようになってるのに。search.debian.org の CJK サポートの話です。サーチエンジンは自然言語解析を必要とするので、国際化がたいへん難しい分野です。というか、--with-extra-charsets をつけるだけで韓国語 (分かち書きする) はサポートされるのだから、あれだけ長い議論をしてるひまがあるのなら、とっととやってくれ。なぜ渋るのか理由が分からん。
最新の mnoGoSearch は 和布蕪 (MeCab) が使えるって話だけど、こっちはどうなんだろう。ChaSen の辞書を使うらしいけど、同様なライセンス問題を抱えていたりはしないのだろうか。
帰ってきました (スコア:1)
ちなみに新幹線だったりします。
ipadicライセンス (スコア:1)
事情も同じです。
cannadicをChaSen/MeCab辞書に変換がするスクリプトは
できているので、それをITPするまで待ってください...
knok