パスワードを忘れた? アカウント作成
14073682 journal
変なモノ

nemui4の日記: ファイル名 18

日記 by nemui4

2バイト文字のファイル名はもう諦めたけど。
ファイル名に、半角全角スペースや"&"や括弧記号を入れられるとちょっとびびってしまう。
できればどっちもSAMBAやFTPでunix側に持っていかないでくれたら嬉しい。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by ei (19798) on 2019年12月20日 18時37分 (#3734832) 日記
    トぢゃなく3バイトでしょー、UTF-8なんだからー。
    • by nemui4 (20313) on 2019年12月21日 6時07分 (#3735040) 日記

      出先で貸してもらう端末のターミナルのエンコード設定がUTF-8で、メンテするシステムは古くてEucなので、毎回まごつく。

      親コメント
    • by Anonymous Coward

      規格上は4バイトまであり得るんじゃなかったっけ。
      3バイト前提だと将来転けそう。

      • by Anonymous Coward

        3バイト以下で表現出来るのはU+0000~U+FFFFのUnicode第0面(BMP)だけで、
        UTF-16でサロゲートペア使う文字やら絵文字やらはその範囲外。
        既にUTF-8の4バイトシーケンスは使われている。

        UTF-8の構造上可能だけど使われていないのは、5〜6バイトシーケンスだね。
        Unicode範囲外の符号化として一応有効だった時期もあるけど今は不正表現扱い。
        Unicodeが第17面突き抜けて第32面まで拡張されたら使われる可能性もありうるかもだが……
        1〜16面がサロゲートペアの表現限界であることを踏まえると、
        UTF-32とかいうネタじみた規格がUTF-16を駆逐するか全部UTF-8になるかしないと拡張は難しそうだ。

  • by Anonymous Coward on 2019年12月20日 17時44分 (#3734801)

    全角はまだ「一律にエンコードされるだろうから」と言う期待ができるけど、
    半角記号は「どうエンコードされるか分からないから」緊張する。

  • by Anonymous Coward on 2019年12月20日 17時46分 (#3734803)

    半角英数字6+3でしょ、普通

  • by Anonymous Coward on 2019年12月20日 19時29分 (#3734859)

    UTF-8で3バイト以上の文字をいつまでも2バイト文字と言うのももう諦めた

    • by nemui4 (20313) on 2019年12月21日 6時09分 (#3735042) 日記

      いつまでも前世紀から動いてるようなシステム相手にしてると時代に取り残されますね。

      親コメント
    • by Anonymous Coward

      老人だけど、UNIX系のOSならバックスラッシュ以外を避ける必要はないはずだと思う。

      • by Anonymous Coward

        まったくその通りな上にバックスラッシュはWindowsにおいてのダメ文字に既に含まれているので
        SambaやFTPで運用する以上そもそも問題が起きることはないわけなんだが
        悲しいかなnemui4とその取り巻き達はしったか君ばかりなので
        ファイル名に、半角全角スペースや"&"や括弧記号が混じった程度で問題が起きると妄想して騒いでいるわけよ
        本当のことを教えてやると何故か荒れる連中ばかりなのでそこは生暖かい目でスルーしたって

        • by Anonymous Coward on 2019年12月20日 23時03分 (#3734979)

          OSがあつかえりゃ安全てか
          ソフトの理不尽な挙動に悩まされた経験が少ないんだな
          ええ時代に生きてるね

          親コメント
        • by nemui4 (20313) on 2019年12月21日 6時13分 (#3735043) 日記

          知ったかですまんです。
          未だに「消せないファイルをなんとかしてください」と言われて見てみると、文字化けしたファイルがゾロゾロあったりして。

          親コメント
        • by Anonymous Coward

          コンソールからはエスケープしないと入力できず
          エスケープの作法がWindowsよりはマシでも統一されてる訳じゃねーから……
          ファイルシステムが受付可能かどうかってだけならNTFSも本来はそこまで駄目文字多くはないが、
          互換性を配慮して弾くようになっているというだけの事。

  • by Anonymous Coward on 2019年12月21日 5時00分 (#3735036)

    逆に今やファイルシステムのユニコードサポートが当たり前の時代に、何百万とある文字のうちいくつかだけが禁止されてる現状に違和感がある。
    ユニコードにファイルシステムで禁止されてる文字の別表現があっても良いんじゃないかと思えるレベル。あるいは不可視のエスケープとか。
    現実的にコマンドラインでの操作を考えれば仕方ないのかもしれないけど。と言ってもエスケープすりゃええやんって話ではある。

typodupeerror

Stay hungry, Stay foolish. -- Steven Paul Jobs

読み込み中...