Maxの日記: [zope]splitter 5
日記 by
Max
いや、あほでした>ワシ
utf-8に対応した日本語が可能なsplitterって、深町さんの開発中の
MeCabSplitter(か?)しか無いのですよね。そらCMFだろうが
なんだろうがダメですわな・・・
相変わらず毛深くないワシ(鬱
いや、あほでした>ワシ
utf-8に対応した日本語が可能なsplitterって、深町さんの開発中の
MeCabSplitter(か?)しか無いのですよね。そらCMFだろうが
なんだろうがダメですわな・・・
相変わらず毛深くないワシ(鬱
人生の大半の問題はスルー力で解決する -- スルー力研究専門家
ソースを見て! (スコア:1)
(混在していると難しい)
ejSplitter は、デフォルトで入力のエンコードは euc-jp であることを想定してますが、辞書は utf-8 で書かれてます。
Re:ソースを見て! (スコア:1)
> ソースを見れば、多分、どの Splitterも UTF-8 で動くように
> できますよ。
途中kconvで変換するなどしてやればできそうな感じですね。
ま、おちついたらやってみます。労力的にはたいしたことないだろう
と踏んではいるんですが・・・先にMeCabSplitterが出たらあっさり
そっちを入れるかも・・・(他力本願
-- (ま)
Re:ソースを見て! (スコア:1)
>そっちを入れるかも・・・(他力本願
ま、それでもいいと思いますが・・・
日本語のエンコードの自動判定の部分は、UTF-8
が入ると、うまくいっていないものもあるようです。
kconv がどうなのかどうか良く知らないです。
その辺は、深町さんが知っていると思います。
Re:ソースを見て! (スコア:1)
深町さんサイトの関連記事はここですね・・・:
http://www.atransia.co.jp/home/ZenKai/Members/kafka/News/1043278904?pp=1
うむむ。
最近サイトが見えなかったので良くチェックしてませんでしたが
今改めてみるとkconvのページにPython1.5での使用を推奨している
こと、utf-8に関しては検証やデバッグが未ということもあり使わ
ない方がよさそうですね・・・
余談:
Mailmanもウチの鯖はまだ2.0.13なのですが、kconvに依存してます。
これもJapaneseCodec対応したものに置き換えないとマズいかも。
-- (ま)
Re:ソースを見て! (スコア:1)
↑ここでやるそうです(kconvのメンテナンス)