アカウント名:
パスワード:
少ないもんだなぁと思った。コード以外のメディア等のデータは除いたのかな。
えーこれおれのしょーもないリポジトリもアーカイブしてもろてるの?お手数おかけして大変申し訳ございませんなんだが。
今年2月2日だから俺もだ。
ほとんどがfolkやコピペしたコードで、圧縮したらみんな仕事してないのがバレちゃった
データが巨大なので「すべてのリポジトリの中から似通ったデータを探す(全リポジトリを一つに連結してから圧縮)」なんて無駄に時間を食うようなことはしていないと思う。リポジトリ単位やプロジェクト単位の圧縮、小規模なものは複数まとめて圧縮くらいがせいぜい。
gitだったらせっかくすべてのオブジェクトがhash値で管理されているのだし、hash値の同じgitオブジェクトは重複しないようにするくらいのことはしていそう。
hash値が同じならそこにぶら下がる実体データはひとつしかないわけで、「hashが同じオブジェクトが重複しないように」は「元からそうなってる」なわけだけど
もともとのストレージがdedupなのかも知れんよ。
これ全公開リポジトリではないです。・2019-11-13 .. 2020-02-02 の間にコミットがある・2019-02-03 .. 2020-02-02 の間にコミットがあり、スターが1以上・スターが250以上のいずれかの条件を満たすリポジトリのみです。まあ条件はかなりゆるいので、相当数のリポジトリが該当するとは思いますが。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
吾輩はリファレンスである。名前はまだ無い -- perlの中の人
意外と (スコア:5, 興味深い)
少ないもんだなぁと思った。
コード以外のメディア等のデータは除いたのかな。
Re: (スコア:0)
えーこれおれのしょーもないリポジトリもアーカイブしてもろてるの?お手数おかけして大変申し訳ございませんなんだが。
Re: (スコア:0)
今年2月2日だから俺もだ。
Re: (スコア:0)
ほとんどがfolkやコピペしたコードで、圧縮したらみんな仕事してないのがバレちゃった
Re: (スコア:0)
データが巨大なので「すべてのリポジトリの中から似通ったデータを探す(全リポジトリを一つに連結してから圧縮)」なんて無駄に時間を食うようなことはしていないと思う。
リポジトリ単位やプロジェクト単位の圧縮、小規模なものは複数まとめて圧縮くらいがせいぜい。
Re: (スコア:0)
gitだったらせっかくすべてのオブジェクトがhash値で管理されているのだし、hash値の同じgitオブジェクトは重複しないようにするくらいのことはしていそう。
Re: (スコア:0)
hash値が同じならそこにぶら下がる実体データはひとつしかないわけで、「hashが同じオブジェクトが重複しないように」は「元からそうなってる」なわけだけど
Re: (スコア:0)
もともとのストレージがdedupなのかも知れんよ。
Re: (スコア:0)
これ全公開リポジトリではないです。
・2019-11-13 .. 2020-02-02 の間にコミットがある
・2019-02-03 .. 2020-02-02 の間にコミットがあり、スターが1以上
・スターが250以上
のいずれかの条件を満たすリポジトリのみです。まあ条件はかなりゆるいので、相当数のリポジトリが該当するとは思いますが。