アカウント名:
パスワード:
まぁ少なくとも10兆バイトの文字列を書く必要があるからその容量になったんだろうけど、個人でこの量は凄い。あるHDDの中身は円周率の一部分のみが延々と書かれているわけか、これはこれで凄い。
また挑戦するのであれば次は「効率」も考慮した内容になると面白そう
> まぁ少なくとも10兆バイトの文字列を書く必要があるからその容量になったんだろうけど、個人でこの量は凄い。
ギネスブックに記録を申請して、晴れて記録更新が認められた暁には、その10兆バイトがギネスブックに記録されるんでしょうか。
アカシックレコードへのポインタのバイト数は相当なものになりそうだが。
そうそう、だから、シェークスピアをアカシックレコードから取り出すには、結局、シェークスピアを書くしかない。
アカシックレコードを理想的な無限系列としても任意のデータを圧縮する時に、圧縮後のデータ長(ポイントバイト数)の期待値が元のデータの平均データ長と同じになるのは容易に証明できるはず
系列が1ケタ増えたときに表現できるデータの種類は1種類しか増えないからね(元が固定長データの場合。可変長データだと元のデータサイズも記録しておかないと復元できない)
例:2ビット圧縮するときに必要なアカシックレコード -> 001100 -> ポインタ位置 001 -> ポインタ位置 110 -> ポインタ位置 3(ローテート)11 -> ポインタ位置 2結局記録には2ビット必要
THcomp「アカシックレコード圧縮が論破されたようだな」
ZeoSync「だが、やつは我ら無限圧縮の中では一番の小物…」
四次元ポケット「マジレスごときに負けるとは無限圧縮の面汚しよ」
アカシックレコードへのポインタは可変長なんですよ。しかも連想配列です。
例えば円周率の10兆桁目の値は、「πの10兆桁目」これだけで呼び出せるんですよ!
可変長ポインタって素晴らしい。
となると10兆桁までのπは
πの1桁目とπの2桁目とπの3桁目と...πの10兆桁目
と書けばいいわけですね。あれ。
信濃毎日新聞の記事 [shinmai.co.jp]だと
20兆桁が新たな目標だが、「根本的に計算の原理を変えたい」といい、計算を始めるのは1年以上先になる見込みだ。
とおっしゃっていますね。たぶんGPUcomputingか、並列クラスタの事をおっしゃっているんじゃないかなー.
プログラムを書いた人のサイト(?) [numberworld.org]で詳細が見られますが [numberworld.org]HW的には前回5兆桁を計算したときに加えてRAIDコントローラが一つ追加され、HDDが2倍になった程度でそれほど変更はないみたいです。(と言うかXeon自体5690が追加された程度で余り変わってないし)
これで計算の原理を変えたい、と言うのだから、たぶん次にはSandy-Eまたはivy-EのXoenE5 番台×2にTesraとかガンガン加えてやってくれるに違いないと期待してます。#いや計算アルゴリズムの話かも知らんけど
#件のサイト、「The Earthquake...」とかそこら辺の影響とか、HWトラブルの時系列とか書いてあって興味深い#またTest Runではオーバークロックしたマシンを使ってるのに本運用は定格運用のXeonなんだな [numberworld.org]とかいろいろ参考になります
計算の原理といったらアルゴリズムでしょあなたが書き連ねているのは計算機の構成
そりゃそうでしょ。上の人は同じ構成でアルゴリズムだけいじるのか、GPGPUなどを入れてアルゴリズムをいじるのかと言う話をしている。このクラスになったら適当にアルゴリズム"だけ"をいじったって代わりはしないし、CPUのアーキテクチャが変わっただけでそのCPU向けに調整を加えるような世界なんだが。
なんか「新しい運転方法を試すと言うけど、根本的にと言うのだから自動車はハイブリットカーにしてそれに合わせた技術を使うのかな」という話に「運転と言ったら技術でしょ。あなたが書き連ねているのは自動車の構成」とコメントするような味わい深い感じですね。
計算用ストレージに48TBってのもすごいけど、メモリ96GBってのも圧巻ですね合計30台のHDDで1年に9回読み書きエラー出てるけどなんとか乗り切ってるみたいだし二重化・クラスタ化するより1台で最強最速を狙うって姿勢がストイックでかっこいいなあ
ちょ、HDDのエラー多過ぎ。ここまで酷使すると不具合の出るのも早いんだね。結局8回エラーで、うち2回は同一モデルすべてをリプレースしてるんだけど、何台変えたんだろう。あらかじめエージングすればいけるかもしれないけれど、2TのHDD使うのも限界にきているのかも。メモリの使い方、メディアのチョイスや冷却方法等々、記憶系の刷新もあるんじゃないかなー
次の挑戦は桁数を増やすことなんですね円周率のチャレンジはよく見るけど、eのチャレンジはあまりないんですかねアルゴリズムが難しいとか?
先生!壁紙やマスコットが気になって内容が全然頭に入ってきません!
>まぁ少なくとも10兆バイトの文字列を書く必要がある
1バイトで10進数3桁弱を表現できるので、10進で10兆桁だからといって10兆バイトにはなりませんよ。
文字列でしょ
確かに10進数で10兆桁だったら 10^13 log_2(10) ビットで記録できそうですね。10兆バイトかけて記録すると約9.09TB必要なのに対し、10進数を無理やりバイト表記に押し込んで記録すれば約3.78TBで記録できるはずですので、その差は歴然ですね!
読売の記事 [yomiuri.co.jp]には「ハードディスクの記憶容量を一般パソコンの約50台分の48TB(テラバイト)に増強して」とあるので、一般パソコンは約1TBの計算ですね。いいなあ。
log_2(10)ビット(≒3.32bit)しかない情報を8ビット(1バイト)もかけて記録したら非効率極まりないでしょう。
例えば10兆ケタなら
10^13バイト → 約9.09TB10^13 log_2(10) ビット → 約3.78TB
48TBでしょ?バイナリデータでよければうちでもそれくらい総量あるよただし動画系だけどw
とても生きている間には観切れないのだが・・なぜか溜まる一方
1億桁ずつzipファイル(約57MB)にして5兆桁分(5万ファイル)、計約3TBをwebに上げてるのも凄い。http://ja0hxv.calico.jp/pai/pivalue5.html [calico.jp]
圧縮…できるのかっ!?
#アスキーからバイナリだからか
どちらかというとMD5ハッシュの値を掲載してほしいですね。記録更新を目指す他の方が計算の確認が出来るので。
別コメントにありますが、別ページで5兆桁から1兆桁毎に100桁づつ公開されています。http://www.numberworld.org/misc_runs/pi-10t/details.html [numberworld.org]10進数で一部の桁のみ誤るというのも絶対ないとは言えないでしょうけれども、ある桁以降がすべて誤っていることの方が多いでしょうから、簡易検査ではこれでOKでは?最終的には全数検査になるでしょうし。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日本発のオープンソースソフトウェアは42件 -- ある官僚
HDDの中身 (スコア:2)
まぁ少なくとも10兆バイトの文字列を書く必要があるからその容量になったんだろうけど、個人でこの量は凄い。
あるHDDの中身は円周率の一部分のみが延々と書かれているわけか、これはこれで凄い。
また挑戦するのであれば次は「効率」も考慮した内容になると面白そう
素朴な疑問 (スコア:1)
> まぁ少なくとも10兆バイトの文字列を書く必要があるからその容量になったんだろうけど、個人でこの量は凄い。
ギネスブックに記録を申請して、晴れて記録更新が認められた暁には、その10兆バイトがギネスブックに記録されるんでしょうか。
Re:素朴な疑問 (スコア:1)
アカシックレコードへのポインタのバイト数は相当なものになりそうだが。
Re: (スコア:0)
そうそう、だから、シェークスピアをアカシックレコードから取り出すには、結局、シェークスピアを書くしかない。
Re: (スコア:0)
アカシックレコードを理想的な無限系列としても
任意のデータを圧縮する時に、圧縮後のデータ長(ポイントバイト数)の期待値が
元のデータの平均データ長と同じになるのは容易に証明できるはず
系列が1ケタ増えたときに表現できるデータの種類は1種類しか増えないからね
(元が固定長データの場合。可変長データだと元のデータサイズも記録しておかないと復元できない)
例:2ビット圧縮するときに必要なアカシックレコード -> 0011
00 -> ポインタ位置 0
01 -> ポインタ位置 1
10 -> ポインタ位置 3(ローテート)
11 -> ポインタ位置 2
結局記録には2ビット必要
Re:素朴な疑問 (スコア:2)
THcomp「アカシックレコード圧縮が論破されたようだな」
ZeoSync「だが、やつは我ら無限圧縮の中では一番の小物…」
四次元ポケット「マジレスごときに負けるとは無限圧縮の面汚しよ」
Re: (スコア:0)
アカシックレコードへのポインタは可変長なんですよ。
しかも連想配列です。
例えば円周率の10兆桁目の値は、
「πの10兆桁目」
これだけで呼び出せるんですよ!
可変長ポインタって素晴らしい。
Re: (スコア:0)
となると10兆桁までのπは
πの1桁目とπの2桁目とπの3桁目と...πの10兆桁目
と書けばいいわけですね。あれ。
Re:HDDの中身 (スコア:1)
また挑戦するのであれば次は「効率」も考慮した内容になると面白そう
信濃毎日新聞の記事 [shinmai.co.jp]だと
20兆桁が新たな目標だが、「根本的に計算の原理を変えたい」といい、計算を始めるのは1年以上先になる見込みだ。
とおっしゃっていますね。たぶんGPUcomputingか、並列クラスタの事をおっしゃっているんじゃないかなー.
プログラムを書いた人のサイト(?) [numberworld.org]で詳細が見られますが [numberworld.org]HW的には前回5兆桁を計算したときに加えてRAIDコントローラが一つ追加され、HDDが2倍になった程度でそれほど変更はないみたいです。(と言うかXeon自体5690が追加された程度で余り変わってないし)
これで計算の原理を変えたい、と言うのだから、たぶん次にはSandy-Eまたはivy-EのXoenE5 番台×2にTesraとかガンガン加えてやってくれるに違いないと期待してます。
#いや計算アルゴリズムの話かも知らんけど
#件のサイト、「The Earthquake...」とかそこら辺の影響とか、HWトラブルの時系列とか書いてあって興味深い
#またTest Runではオーバークロックしたマシンを使ってるのに本運用は定格運用のXeonなんだな [numberworld.org]とかいろいろ参考になります
Re:HDDの中身 (スコア:1)
計算の原理といったらアルゴリズムでしょ
あなたが書き連ねているのは計算機の構成
Re:HDDの中身 (スコア:1)
そりゃそうでしょ。
上の人は同じ構成でアルゴリズムだけいじるのか、GPGPUなどを入れてアルゴリズムをいじるのかと言う話をしている。
このクラスになったら適当にアルゴリズム"だけ"をいじったって代わりはしないし、CPUのアーキテクチャが変わっただけでそのCPU向けに調整を加えるような世界なんだが。
なんか「新しい運転方法を試すと言うけど、根本的にと言うのだから自動車はハイブリットカーにしてそれに合わせた技術を使うのかな」という話に「運転と言ったら技術でしょ。あなたが書き連ねているのは自動車の構成」とコメントするような味わい深い感じですね。
Re:HDDの中身 (スコア:1)
計算用ストレージに48TBってのもすごいけど、メモリ96GBってのも圧巻ですね
合計30台のHDDで1年に9回読み書きエラー出てるけどなんとか乗り切ってるみたいだし
二重化・クラスタ化するより1台で最強最速を狙うって姿勢がストイックでかっこいいなあ
Re: (スコア:0)
ちょ、HDDのエラー多過ぎ。
ここまで酷使すると不具合の出るのも早いんだね。結局8回エラーで、うち2回は同一モデルすべてをリプレースしてるんだけど、何台変えたんだろう。
あらかじめエージングすればいけるかもしれないけれど、2TのHDD使うのも限界にきているのかも。
メモリの使い方、メディアのチョイスや冷却方法等々、記憶系の刷新もあるんじゃないかなー
Re: (スコア:0)
次の挑戦は桁数を増やすことなんですね
円周率のチャレンジはよく見るけど、eのチャレンジはあまりないんですかね
アルゴリズムが難しいとか?
Re: (スコア:0)
先生!壁紙やマスコットが気になって内容が全然頭に入ってきません!
Re:HDDの中身 (スコア:1)
>まぁ少なくとも10兆バイトの文字列を書く必要がある
1バイトで10進数3桁弱を表現できるので、10進で10兆桁だからといって10兆バイトにはなりませんよ。
Re: (スコア:0)
文字列でしょ
Re: (スコア:0)
確かに10進数で10兆桁だったら 10^13 log_2(10) ビットで記録できそうですね。
10兆バイトかけて記録すると約9.09TB必要なのに対し、10進数を無理やりバイト表記に押し込んで記録すれば約3.78TBで記録できるはずですので、その差は歴然ですね!
Re: (スコア:0)
読売の記事 [yomiuri.co.jp]には「ハードディスクの記憶容量を一般パソコンの約50台分の48TB(テラバイト)に増強して」とあるので、一般パソコンは約1TBの計算ですね。
いいなあ。
Re: (スコア:0)
log_2(10)ビット(≒3.32bit)しかない情報を8ビット(1バイト)もかけて記録したら非効率極まりないでしょう。
例えば10兆ケタなら
10^13バイト → 約9.09TB
10^13 log_2(10) ビット → 約3.78TB
Re: (スコア:0)
48TBでしょ?
バイナリデータでよければうちでもそれくらい総量あるよ
ただし動画系だけどw
とても生きている間には観切れないのだが・・なぜか溜まる一方
Re: (スコア:0)
1億桁ずつzipファイル(約57MB)にして5兆桁分(5万ファイル)、計約3TBをwebに上げてるのも凄い。
http://ja0hxv.calico.jp/pai/pivalue5.html [calico.jp]
Re:HDDの中身 (スコア:2)
圧縮…できるのかっ!?
#アスキーからバイナリだからか
Re:HDDの中身 (スコア:1)
どちらかというとMD5ハッシュの値を掲載して
ほしいですね。記録更新を目指す他の方が
計算の確認が出来るので。
Re:HDDの中身 (スコア:1)
別コメントにありますが、別ページで5兆桁から1兆桁毎に100桁づつ公開されています。
http://www.numberworld.org/misc_runs/pi-10t/details.html [numberworld.org]
10進数で一部の桁のみ誤るというのも絶対ないとは言えないでしょうけれども、ある桁以降がすべて誤っていることの方が多いでしょうから、簡易検査ではこれでOKでは?
最終的には全数検査になるでしょうし。