パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

英国公衆衛生庁がCovid-19の陽性症例者1万6千件のデータを喪失。原因はXLS形式の行制限」記事へのコメント

  • 普通は、各拠点からの集約データと個別データがあっているとか、一日の集計上の件数と個別データの件数があっているとかそれなりのチェックプロセスがあると思うんだけどね。
    だいたい、送られてきたデータはその日付フォルダにぶち込んで一定期間取っておかないと怖い気がする。
    別にサーバー上の集計bookだけ2007形式「xlsm」とかでつくれば、解決する案件かな
    • ボリュームシャドウコピーでよくない?

      あるいは、gitつかうとか。

      • by Anonymous Coward

        xls使ってるような(そんなしょぼい仕事受けてる)ところがそんなもの知ってるわけないだろ

        • と言うより、#3902491 [srad.jp]自体、VSSもVCSも知らなさそうに見えるね。

          親コメント
          • by Anonymous Coward

            上書きするファイルじゃないと思うが。
            日別に受信したものを全部残しとけという話でgit使っても意味ないだろ。

            個人的にはそれなりのDBMS使えとは思うけど。

            • 日別に受信したものを全部残しとけという話でgit使っても意味ないだろ。

              そう言う前提で、「日付フォルダにぶち込んで一定期間取ってお」けばいい、程度のもんなら、gitでも構わんのじゃないか。

              逆にDBMSで安心できるのか、って気もするな。
              DBを何世代かバックアップを取っておけば安心できるのかもしれんね。

              親コメント
              • by Anonymous Coward

                更新しないファイルにgitを使う意味がわからんということでは。

              • by Anonymous Coward

                よくわからんのだけど、オリジナルのデータを手を加えずしばらくの間保管していらなくなったら捨てるという用途にgitが向いてんの?

              • by Anonymous Coward
                >オリジナルのデータを手を加えずしばらくの間保管していらなくなったら捨てるという用途にgitが向いてんの?
                無理に使う必要は無いと思う
                スナップショットツール。任意の時点のスナップショットを取り出せるのはいいことかしれないけど、目的的には、普通にバックアップをとればいいんじゃないかな。
              • いまどき、CSVファイルとストレージ領域の大きさを比べれば、削除しようがずーっと取っておこうが、どちらでも構わんだろ。

                この場合、更新の有無は定かではないと思うけどね。
                たまには差し替えとかあるのかもしれんし。

                親コメント
              • 向いてるかどうか、って話なら、前にも指摘した通り、VSSで十分。
                Gitでもいいんじゃないか、って程度。

                そもそも、要らなくなったら捨てる、なんて貧乏臭い運用は今どき時代遅れだよ。
                CSVファイルの大きさなんか、たかが知れてるんだから。
                邪魔にならない程度にワーキングディレクトリを整理して、ずーっと取っておけばいい。
                しばらく取っておかないと不安、って動機ならなおのこと。

                親コメント
              • 目的的には、普通にバックアップをとればいいんじゃないかな。

                その「普通にバックアップ」って、具体的にはどういう方法?
                バックアップツールで定期増分バックアップを取るとか? それが今回の「目的的」にVSSより使い勝手が良いとは思えないけどなあ。
                もちろん、データ保全という意味では優れてると思うけど。

                親コメント
              • by Anonymous Coward
                >データ保全という意味では優れてると思うけど。
                結論が出ましたね。
                単純さは無難だから。無理にオーバースペックである必要はない。
                教育しなくても、誰でもやりたいことが操作が出きるしね。
                そういっても空間は有限なんだから、ふさわしい期限を付けて消すルールを決める。
                間違って操作してもOS レベルで救済がある。その程度の話じゃないかな。
              • >データ保全という意味では優れてると思うけど。
                結論が出ましたね。

                データ保全に優れている、ってのはたとえば、専用のバックアップツールを使って、定期増分バックアップを別メディアに取る場合とかだよ。
                キミ、解ってないでしょ? キミが言うような、日付ファイル名を使う方法では、データ保全性は、保証できないよ。

                そういっても空間は有限なんだから

                なんでそんなに貧乏くさい前世紀的発想から逃れられないんだい?
                そのデータ、XLSだかCSVだかは知らんけど、何MiBあるって話?
                全部取っておいたって、百年以上保存し続けることができるレベルでは?

                ふさわしい期限を付けて消すルールを決める。

                そのルールの運用が破綻するだろう。そんな例はたくさんある。
                そして、その削除を人手に頼る限り、間違って消しちゃダメなものを消してしまうことは有り得る。
                そんな前時代的な日付ファイル名+人力管理に頼るよりは、VSSの方がいいだろ。

                もしかして、新しい技術に付いていきたくない人?
                そう言う人を受け入れざるを得ない残念な現場なら、キミの言うような方法で仕方ないと思うよ。
                実際、私もそう言う現場に当たることもある。

                親コメント
              • by Anonymous Coward

                まさにそういう臭いがプンプンする現場のケースだろこれ

              • まさにそういう臭いがプンプンする現場のケースだろこれ

                この現場もっとヒドくて、間違って大切なファイルを削除しちゃったりする。
                だから、信用ならない人手の操作に頼らず、自動化できる仕組みの方が良い。
                VSSなら、今回の様な操作ミスはすぐに救えたのは解るよな?

                親コメント
              • by Anonymous Coward

                この事例でファイル名に日付がついているのはバックアップ目的じゃないだろ。
                ファイルなるフォルダに日付がついていたらバックアップと思い込むのやめたら。

              • ファイルなるフォルダに日付がついていたらバックアップと思い込むのやめたら。

                スレッドをざっと見まわした限り、日付パス名がバックアップだ、と言う趣旨のことを書いた人は、キミだけの様だよ。
                少なくとも私はそんなことは書いてない。

                ちなみに、私が提案したVSSもVCSも、バックアップではない。
                リモートリポジトリに保存するVCSは、バックアップと考えることもできるけど、そう言う趣旨で言っているわけでも無い。

                親コメント
          • by Anonymous Coward
            うーん、そういうのは結局柔軟なバックアップ以上のものではなくない?
            過去からの修正版がもう一回送られてきて、遡って訂正とかEXCELファイルでやる以上何があるかわからんから、日付フォルダ構造をもつお話と、その構造が任意の時点に戻せるているという話をごっちゃにするには違うと思うけどね。
            • うーん、そういうのは結局柔軟なバックアップ以上のものではなくない?

              VSSはそうだね。
              VCSは違うだろ。
              前提によって良いツールを選べばいい。
              どちらを選んでも、日付フォルダを作るよりマシじゃないかな。

              まあ、ユーザがに新しいツールを勉強する意欲や能力が無い、ということなら話は違うけど。

              親コメント
          • by Anonymous Coward

            このケースはそんなの使うより日付フォルダで管理するのが適切だと思うけどなあ。
            ログのローテーションみたいなもんじゃないの。普通に日付ごとにファイルとして存在してた方がいいでしょ。

            • なんでローテーションなんて貧乏臭い考えから逃れられないのかな?
              ファイル一つ辺りせいぜい数MiBとかだろ? 全部取っとけよ。
              そこいらのホームセンターで売ってるSDカードだって、百年分以上の容量あるよね。
              ただ、ワーキングディレクトリが散らかるのは良くないだろうから、VCSを使いな、ってこと。

              親コメント
              • by Anonymous Coward

                センシティブなデータをいつまで取っといていいものかという問題もある

              • そんなにセンシティブだと言うのなら、いまどき匿名化してから処理するんじゃないの?
                三日分なら流出してもいい、って話でもないだろ?

                親コメント
              • by Anonymous Coward

                その匿名化処理でExcel使ってまた何万件かぶっ飛んだりしてな
                最初はバグってた時のために生データをとっとこうという話だったのにな
                とにかく反論しないと気が済まないのかね

              • その匿名化処理でExcel使ってまた何万件かぶっ飛んだりしてな

                それは有り得る話だけど、匿名化処理をしない場合でも同じように有り得る話だし、匿名化処理をしない場合は、流出した場合の被害は大きい。
                センシティブさを云々し始めたのはキミだと思うが、もう忘れちゃったのか?

                とにかく反論しないと気が済まないのかね

                反論…というレベルの話にも達してないんだけどな、キミ相手じゃ。

                親コメント

ソースを見ろ -- ある4桁UID

処理中...