パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

IPAオープンソフトウェア活用基盤整備事業のSamba国際化プロジェクト成果公開」記事へのコメント

  • by prajna (18168) on 2004年04月02日 11時42分 (#525399)
    文字魔空間でのWindows・Linux・Macintosh(のModified NFD対応もしてるんで
    すよね?)界の深い谷間の橋渡し作業、お疲れ様でした。

    ページを読んで気付いたのですが、今回またもや新しい(というか発掘された)
    文字コード“eucjp-ms”が登場するのですね。「Unixユーザは日本語ファイル名
    ですら滅多に使わないんだから空き部分は好き勝手するぜ」といって入れたの
    かどうか知りませんが、次のLonghornはJIS X 0213文字セットが入るので、
    Samba3.0のこの選択はその時には破綻しそう。いっそのこと、 EUC-JISX0213
    にして、CP932の私用文字と、JIS X0213に採用されなかった「シグマとぁゃιぃ
    84漢字」については、そんなものファイル名として使うな!と強権的に排除す
    る方が、実際にこれらの文字がファイル名に使われるよりはましかもしれません。

    Longhorn登場までにUnix界のファイル名もUTF-8化されるかといえば、もともと
    Unixそのものが保守的な上、NFSサーバなんてヘテロな環境で使われる代表格な
    サーバなのでそれも難しそうです。今、日本語ファイル名を使おうとしている
    Fedora ユーザは苦しんでると思うんですが、そもそもNFSのようなファイル名
    を文字列でなくオクテット列として扱うファイルシステムを使うのが悪!
    Unixユーザ同士のファイル共有もSambaを使えって結論ですかそうですか。

    でも残念ながら、そもそもMicrosoftとJava(JIS)とGlibcではどのJISの文字を
    どのUnicodeに割り当てるか、全部ばらばらなので、結局、ファイル名はEUCで
    統一した方が、この差異を吸収できるから無難という話もあり…

    結論としては、NFSのようにファイル名をオクテットで持つファイルシステムを、
    encodingに応じて適切な文字列に変換して見せることができるような、 文字列
    に対して中立な上乗せ型のファイルシステムが欲しいと思う今日この頃です。
    • by Anonymous Coward on 2004年04月02日 12時06分 (#525404)
      SambaにしてもSambaだけで話が完結すればそれほど問題はないんですが
      • Samba上の日本語ファイル(丸数字とかローマ数字含む)を、unix側にloginした時も正常に表示したい
      • Samba上の日本語ファイルををftpでもアクセスしたい
      • Samba上の日本語ファイルをapacheでWeb上に公開したい
      とかいわれると、とたんに頭が痛くなります。
      親コメント
    • by Anonymous Coward on 2004年04月02日 12時04分 (#525403)
      >そんなものファイル名として使うな!と強権的に排除する方が、実際にこれらの文字がファイル名に使われるよりはましかもしれません。

      Windows上でドラッグ&ドロップで何気なくコピーしたら、途中でエラーが出てコピーできない、っていうのもまずいかも。 できる限り何とか取り込もうという方が汎用性が高く、目的にも沿うように思います。

      親コメント

日々是ハック也 -- あるハードコアバイナリアン

処理中...