パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

中国で10億人規模の個人情報が流出」記事へのコメント

  • by Anonymous Coward on 2022年07月06日 13時43分 (#4283965)

    早速25万人分をサンプリングして人口ピラミッドを調査した人がいて、
    「2020年の公式発表と大きく違う」ことが分かったようです。
    出生率が尋常じゃないほど下がっており、総人口は14億ではなく約12.8億ではないかとの事。

    #ソースは探して; 中国語のキャプ画像だった。

    • >「2020年の公式発表と大きく違う」ことが分かったようです。

      中国共産党が国内事情をそのまま公式発表する理由は無いので、それで正しいかと。

      親コメント
      • by Anonymous Coward

        さらに突っ込むと中国共産党指導部が地方の状況をしっかり把握できているかも怪しかったり
        (役人が正しい情報を取得できているか?と得た情報を上に報告しているか?という2重の意味で)

        • by Anonymous Coward

          いんや、しっかり把握してると思うなあ。
          顔認識カメラを国中に設置して監視しているから、パーフェクト引きこもり以外はカウントできると思う。

          • by Anonymous Coward

            引きこもりはカウントされないか

            そう言えば人身売買で何十年も自宅で監禁されてた人が発見されて話題になったっけ
            たくさんの子供を産んで地元ではテレビに出るぐらい有名人だったが
            たまたまテレビに映って話題になった(映っても問題ないと周りの人も思ってたのが凄いわ)

            田舎じゃいまだに人身売買が多いんじゃないかな
            都心部との差が激しい国だからね

    • by Anonymous Coward

      なるほど。
      つまり、どうやらこの流出データはフェイクだと(棒

    • by Anonymous Coward

      そんな一割近くごまかせるもんなのか…?
      いやでも確かに一人ひとり数えて確認なんかできんしな…

      • by Anonymous Coward
        中国だしなあ。
        觔斗雲で飛んでいかないと隣の家にも行けない田舎とか、逆にそのビルに何万人住んでいるのか誰も知らない都会とか。

        #個人のイメージです
      • by Anonymous Coward

        そもそもそのデータが完全に網羅されていたとどうやって確認したのだろうか?
        中国の僻地って下手すりゃ電気も通信も無いような所もまであったはずだが。

        • by Anonymous Coward

          それは「中国の人口はどうやって統計取っているんだ」というそもそもの話にも繋がる訳で。

          経済成長率は各行政区が(目標達成するように数字を弄って)報告したのを積み上げた結果という話を聞きますしね。

    • by Anonymous Coward

      母集団が偏ってないかってとこが重要だからな。田舎と都市部じゃ違うだろうし。

      #「日本のネット普及率は100% ※ネットアンケートによる調査」

    • by Anonymous Coward

      まとめブログですがこちら。

      https://matomedane.jp/page/107587 [matomedane.jp]

    • by Anonymous Coward

      母集団に対して0.1%以下のサンプルサイズじゃ少なすぎるだろう。

      • by Anonymous Coward

        コメントには同意のうえで、サンプリングにバイアス(偏り)がありそうにも思う。
        公安が持っている人民リスト、には人民のうち成年層は天網恢恢疎にして漏らさずだと思うが、幼児年代はそもそも人民リストを網羅しようという動機すらないんではないか

        • 「七つまでは人民たらず」?
          // 混ぜるな
          親コメント
        • by Anonymous Coward

          流出データにバイアスはあるだろうと思うけど、サンプルサイズが小さすぎるってことはないだろう
          サンプリング誤差の計算には元のデータの数なんか関係ないわけで

          • by Anonymous Coward

            流出データにバイアスはあるだろうと思うけど、サンプルサイズが小さすぎるってことはないだろう
            サンプリング誤差の計算には元のデータの数なんか関係ないわけで

            サンプリングがランダムならいいんだけど、公的機関のデータベースって何等かの方法でソートかけられていておかしくない、というは普通はソートされている、所属地域か政府に対する従順度かはしらんが。
            今回リークされた情報は、元のリストからランダムサンプリングされたという保証はない。

            10億人のリストのうちの25万人を抽出したとして、ランダムに並べられたリストから25万人なら小さすぎはないが、そのリストがソートされていて、その25万人が「上海に住んでいる25万人」なのか、「○○少数民族自治区に住んでいる25万人」なのか、では統計情報に偏りはでる。

            こういう疑いをもつことはデータを見るときには大事。疑いすぎると何も見えなくなるけどな

            • by Anonymous Coward

              言いたいことはわかるが、それって「サンプルサイズが小さすぎる」という問題ではないよな
              サンプルに偏りがあるんじゃないかって問題でしょ

              • by Anonymous Coward

                言いたいことはわかるが、それって「サンプルサイズが小さすぎる」という問題ではないよな
                サンプルに偏りがあるんじゃないかって問題でしょ

                え、いやだから

                  (#4284184) は次のように言っている。なんか会話にすれ違いが出てるかな?
                >コメントには同意のうえで、サンプリングにバイアス(偏り)がありそうにも思う

                根本的解決するには母集団全体で統計とりゃーええで。

              • by Anonymous Coward

                >>母集団に対して0.1%以下のサンプルサイズじゃ少なすぎるだろう。
                >コメントには同意のうえで

                元コメに同意してるから、反対意見がぶら下がってるだけじゃないの。

              • by Anonymous Coward

                それをしたいなら、派生の(#4284184) にぶら下げるのではなく、大本の元コメの(#4284134) に直にぶら下げるべきだろ
                元コメの(#4284134)も直接聞きたいだろうし

              • by Anonymous Coward

                結局言いがかりの付け方ができてない人に引っかかっただけでしたか。はぁ。

      • by Anonymous Coward

        苗字を元に見るとそこそこランダムな分布を示しているようですよ
        低く見積もると実は総人口10億前後ではと見てる人もいますがこれはわからん

アレゲはアレゲ以上のなにものでもなさげ -- アレゲ研究家

処理中...