アカウント名:
パスワード:
64000件のデータで、もし無作為で1000件連続して解約データが含まれていたのであれば、解約率は99%越えてるはずです。なので元々解約者が多く含まれるようなデータなのか、解約者が並びやすい条件でソートしているのか、どちらかでしょう。
あくまで理論上の話だけど、これ、「3月で契約終了」のデータが多数あったと思うのです。そのうち、例えば2年契約とかで「同じ時期にスタートした契約がたまたま同じ時期に終了する」可能性は、そんなに低くないと思われます。それが千件並ぶのはよっぽどのことだと思うけど、ありえない確率とは思えないのです。
一応簡単に計算すると、1000件連続で解約者が並ぶ確率は、解約率が99%としても0.99^1000=0.000043これを64000件分のバッチ処理、1000件を64回まわす間に落ちる確率は0.002755で0.28%弱しかありません。たとえ「3月末契約終了」が多く解約率が99%だとしても、64000件の処理中に1000件連続する確率は0.28%で、実際には解約率はもっと低いはずなのでちょっと起こり得ないかな、と。なので、他のACの方が指摘しているような、1000件とかまとまった件数を契約している業者が解約したとか、そういうのが無いと厳しいかと。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
私は悩みをリストアップし始めたが、そのあまりの長さにいやけがさし、何も考えないことにした。-- Robert C. Pike
面倒だから計算しないけど (スコア:4, 興味深い)
64000件のデータで、もし無作為で1000件連続して解約データが含まれていたのであれば、解約率は99%越えてるはずです。
なので元々解約者が多く含まれるようなデータなのか、解約者が並びやすい条件でソートしているのか、どちらかでしょう。
Re: (スコア:2)
あくまで理論上の話だけど、
これ、「3月で契約終了」のデータが多数あったと思うのです。
そのうち、例えば2年契約とかで「同じ時期にスタートした契約がたまたま同じ時期に終了する」可能性は、そんなに低くないと思われます。
それが千件並ぶのはよっぽどのことだと思うけど、
ありえない確率とは思えないのです。
Re:面倒だから計算しないけど (スコア:4, 参考になる)
一応簡単に計算すると、1000件連続で解約者が並ぶ確率は、解約率が99%としても
0.99^1000=0.000043
これを64000件分のバッチ処理、1000件を64回まわす間に落ちる確率は0.002755で0.28%弱しかありません。
たとえ「3月末契約終了」が多く解約率が99%だとしても、64000件の処理中に1000件連続する確率は0.28%で、実際には解約率はもっと低いはずなのでちょっと起こり得ないかな、と。
なので、他のACの方が指摘しているような、1000件とかまとまった件数を契約している業者が解約したとか、そういうのが無いと厳しいかと。
Re:面倒だから計算しないけど (スコア:2)
Re: (スコア:0)
解約済みのデータまで引っこ抜いてくる処理自体が錯誤的。