パスワードを忘れた? アカウント作成
684819 journal

Maxの日記: [zope]splitter 5

日記 by Max

いや、あほでした>ワシ

utf-8に対応した日本語が可能なsplitterって、深町さんの開発中の
MeCabSplitter(か?)しか無いのですよね。そらCMFだろうが
なんだろうがダメですわな・・・

相変わらず毛深くないワシ(鬱

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • ソースを見れば、多分、どの Splitterも UTF-8 で動くようにできますよ。
    (混在していると難しい)

    ejSplitter は、デフォルトで入力のエンコードは euc-jp であることを想定してますが、辞書は utf-8 で書かれてます。
    • うひゃ。叱られてしまいました・・・

      > ソースを見れば、多分、どの Splitterも UTF-8 で動くように
      > できますよ。

      途中kconvで変換するなどしてやればできそうな感じですね。
      ま、おちついたらやってみます。労力的にはたいしたことないだろう
      と踏んではいるんですが・・・先にMeCabSplitterが出たらあっさり
      そっちを入れるかも・・・(他力本願
      --
      -- (ま)
      親コメント
      • >・・・先にMeCabSplitterが出たらあっさり
        >そっちを入れるかも・・・(他力本願

        ま、それでもいいと思いますが・・・
        日本語のエンコードの自動判定の部分は、UTF-8
        が入ると、うまくいっていないものもあるようです。
        kconv がどうなのかどうか良く知らないです。
        その辺は、深町さんが知っていると思います。
        親コメント
        • > kconv がどうなのかどうか良く知らないです。

          深町さんサイトの関連記事はここですね・・・:
          http://www.atransia.co.jp/home/ZenKai/Members/kafka/News/1043278904?pp=1

          うむむ。

          最近サイトが見えなかったので良くチェックしてませんでしたが
          今改めてみるとkconvのページにPython1.5での使用を推奨している
          こと、utf-8に関しては検証やデバッグが未ということもあり使わ
          ない方がよさそうですね・・・

          余談:
          Mailmanもウチの鯖はまだ2.0.13なのですが、kconvに依存してます。
          これもJapaneseCodec対応したものに置き換えないとマズいかも。
          --
          -- (ま)
          親コメント
typodupeerror

人生の大半の問題はスルー力で解決する -- スルー力研究専門家

読み込み中...