パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Excelのデータってありますか?」記事へのコメント

  • by Anonymous Coward

    神 Excelと違って、楽勝だね。

    "❶","12,000㌕","32.1㌫"
    Ⅱ,1万kg,46

    全部にダブルクォート付きくらいなら、除去するだけだから楽勝だが。
    下手にデータの方にもダブルクォートがある場合ってどうなるんだろ。

    • by Anonymous Coward

      ダブルクォートの出力方法がそもそも複数ある。
      ダブルクォートが2個並ぶ形式(普通はこの形式)でエスケープ。
      バックスラッシュ(円記号)の後ろにダブルクォートでエスケープ。
      ダブルクォートを単なる通常文字として扱う(この場合フィールド内に区切り文字や改行文字は入力不能)。
      もしかすると、ダブルクォートで括った上で区切り文字に隣接しない場合はダブルクォート一文字、
      区切り文字に隣接する場合はダブルクォートを一文字増やすって実装もあり得るだろうか?

      二重ダブルクォートだけサポートしとけば大概は大丈夫だろうけど、
      もし方言含めてパースするなら当該形式で矛盾が起きない形式のうち
      最も一般的な方式であると推定が行えてから読み込みだねぇ……
      区切り文字が破壊されればフィールド数の不揃いで検知できるが、
      全部不揃いなパターンや破壊が起きないパターンだと確定困難。

      • Excelじゃないですが、とある共有のデータベースで備考欄に半角カンマを入れるユーザがいたらしくて。
        担当者がCSVに落として一括処理しようとしたら、失敗して困ってたのを思い出した。

        • by Anonymous Coward

          普通タブ区切りのCSVにするでしょ

          • by Anonymous Coward

            それはTSV(Tab-Separated Values)って言うんじゃないの。

            • by Anonymous Coward

              違う。その呼び方トラブルの元だからマジで止めた方がいいよ。
              CSVはcharacter-separated values、何区切りのCSVか明記するのが推奨される書き方。

              これだってTSV
              あああ🍅いいい🍅うう
              11🍅22🍅33

              • by Anonymous Coward

                いやいやいや、念のためググったけど多くがComma-Separated Valuesで解説されてるじゃないか。

              • by Anonymous Coward on 2020年11月13日 12時45分 (#3923469)

                マジレスすると

                comma-separated values(CSV)
                colon-separated values(CSV)
                space-separated values(SSV)
                slash-separated values(SSV)
                semicolon-separated values(SSV)
                tab-separated values(TSV)
                tomato-separated values(TSV)
                tamakin-separated values(TSV)
                vertical bar-separated values(VSV)

                と重複してしまうから総称して
                character-separated values(CSV)、区切り文字は〇〇
                と表現するようになった。

                親コメント

普通のやつらの下を行け -- バッドノウハウ専門家

処理中...