アカウント名:
パスワード:
この場合の定義は知らないが、おそらくシステムが消費する単位エネルギー当たりの何らかの演算回数の総数だろう。演算素子の単位時間当たりの消費電力は、おおよそ、電源電圧x(ターンオン時間+ターンオフ時間)x各ゲート毎のスイッチング回数の総和、に比例する。記事では大幅に良くなるとのことなので、GPU は CPU に比べて、一演算に要する、各ゲート毎のスイッチング回数の総和が大幅に少なくてすむ、ということだろうか? もしかして、GPU は、必要十分なゲートのみオン/オフしているのか? 最近、グラフィックボードが故障して GPU が使えなくなりどうしようかと思案中の者より。GPU の記事には興味津津なので。
エネルギー効率は、Flops/W、1Wあたりの演算回数で定義されてますね。
GPUのエネルギー効率が高い理由ですけど、一言で言えば、「演算処理に関わるゲート数(無駄)が少ない」ってことですね。GPUは、低機能なコアを数多く積んでいます。最新のGeForceは、512コアを積んでるいものもあったりして、せいぜい8コア程度な普通のCPUとは桁が違います。個々のコアの機能は少ないが、その分回路規模が小さいです。
x86 CPUなんかは、コア自体が高機能なので、どんなプログラムでもそこそこな速さで動きますが、GPUはその性能を引き出すのが難しいです。同じ処理でもプログラム次第
BlueGene/Q(POWER系) 17位 677104 / 340.5 = 1988.56 64位 172494 / 85.12 = 2026.48# 圧倒的。一人別次元。さすが、スパコンのためだけに開発されたプロセッサ。
POWER7(POWER系) 55位 185100 / 501.47 = 369.11 221位 73350 / 129.6 = 565.97# BlueGene/Qと同じPOWER系ながらガクッと落ちる。# 命令セットがエネルギー効率の決定的な要因ではないことがわかる。
PowerXCell 8i(POWER系+独自)
> Xeon X56x0(x86系 Nehalem)> 9位 1050000 / 4590 = 228.76> 140位 89670 / 212.62 = 421.74
同一CPUで倍近くも違うことに何の疑問も持たない上、Sandy BridgeにはAVXがあることも無視とはね。バカじゃないの?
9位はXeon X7560ですね、すみません。Nehalem-EXの存在をすっかり忘れてた。採用数少ないし。(と言い訳)というとでXeon X56x0の上段は 66位 168800 / 510 = 330.98
「同一CPUで倍近くも違うことに何の疑問も持たない」については129位のようなものがたくさんあるので、スルーしてしました。(と言い訳) 129位 96697 / 546.26 = 177.02 (Xeon X5670)
ちなみに「# 他より進んだ32nmを採用してこのありさま。」と書いたのはSandy Bridgeとの比較というよりもOpteron 61xxとの比較から。Xeon X56x0がOpteron 61xxといい勝負。32nm対45nmでマイクロアーキテクチャも後発という2重のアドバンテージがある(もちろんOpteron 61xxにもAVXは未実装という)状況下で、いい勝負。
おまけで補足。(といっても御覧のありさまなので、興味のある人は自分で調べてください)
アーキテクチャごとに2行データがあるのは上段がTOP500での最上位のスコアで、下段がもっとも効率が良いもののスコア。(のはず)
Opteron 61xxが3行あるのは3位の次点のデータを示すため。Tesla 20x0の5位があるのは親コメントに含まれるため。(元々親コメントが「8位よりも効率の悪い3位のデータと2位よりも順位の低い5位」を比べている違和感で調べ始めた)Tesla 20x0の21位があるのは消し忘れ。(5位から21位を抽出して見比べていた)Bulldozerが1行しかないのは消費電力があるデータが1つしかないから。ShenWeiが1行しかないのはそもそも1つしかランクインしてないから。
元コメの者です。
親コメントが「8位よりも効率の悪い3位のデータと2位よりも順位の低い5位」を比べている違和感
特に深い意味はありません。元々、国産同士の比較の方がなじみがあってわかりやすいだろうと、京とTSUBAMEの数字を出してみたら、電力効率がほとんど同じだったものだから、しかたなくTOP500を眺めてx86なスパコンの数字も出してみた、って流れです。(最初はTOP500も見ずに個別のスペック情報で書いてました。それよりはTOP500のリンクの方が統一的なフォーマットでわかりやすいだろうと後から修正。)
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ
エネルギー効率 (スコア:2)
この場合の定義は知らないが、おそらくシステムが消費する単位エネルギー当たりの何らかの演算回数の総数だろう。演算素子の単位時間当たりの消費電力は、おおよそ、電源電圧x(ターンオン時間+ターンオフ時間)x各ゲート毎のスイッチング回数の総和、に比例する。記事では大幅に良くなるとのことなので、GPU は CPU に比べて、一演算に要する、各ゲート毎のスイッチング回数の総和が大幅に少なくてすむ、ということだろうか? もしかして、GPU は、必要十分なゲートのみオン/オフしているのか? 最近、グラフィックボードが故障して GPU が使えなくなりどうしようかと思案中の者より。GPU の記事には興味津津なので。
Re: (スコア:2)
エネルギー効率は、Flops/W、1Wあたりの演算回数で定義されてますね。
GPUのエネルギー効率が高い理由ですけど、一言で言えば、「演算処理に関わるゲート数(無駄)が少ない」ってことですね。
GPUは、低機能なコアを数多く積んでいます。最新のGeForceは、512コアを積んでるいものもあったりして、せいぜい8コア程度な普通のCPUとは桁が違います。
個々のコアの機能は少ないが、その分回路規模が小さいです。
x86 CPUなんかは、コア自体が高機能なので、どんなプログラムでもそこそこな速さで動きますが、
GPUはその性能を引き出すのが難しいです。同じ処理でもプログラム次第
長文失礼 (スコア:1)
BlueGene/Q(POWER系)
17位 677104 / 340.5 = 1988.56
64位 172494 / 85.12 = 2026.48
# 圧倒的。一人別次元。さすが、スパコンのためだけに開発されたプロセッサ。
POWER7(POWER系)
55位 185100 / 501.47 = 369.11
221位 73350 / 129.6 = 565.97
# BlueGene/Qと同じPOWER系ながらガクッと落ちる。
# 命令セットがエネルギー効率の決定的な要因ではないことがわかる。
PowerXCell 8i(POWER系+独自)
Re: (スコア:0)
> Xeon X56x0(x86系 Nehalem)
> 9位 1050000 / 4590 = 228.76
> 140位 89670 / 212.62 = 421.74
同一CPUで倍近くも違うことに何の疑問も持たない上、Sandy BridgeにはAVXがあることも無視とはね。
バカじゃないの?
バカでした。 (スコア:0)
9位はXeon X7560ですね、すみません。
Nehalem-EXの存在をすっかり忘れてた。採用数少ないし。(と言い訳)
というとでXeon X56x0の上段は
66位 168800 / 510 = 330.98
「同一CPUで倍近くも違うことに何の疑問も持たない」については
129位のようなものがたくさんあるので、スルーしてしました。(と言い訳)
129位 96697 / 546.26 = 177.02 (Xeon X5670)
ちなみに「# 他より進んだ32nmを採用してこのありさま。」と書いたのは
Sandy Bridgeとの比較というよりもOpteron 61xxとの比較から。
Xeon X56x0がOpteron 61xxといい勝負。
32nm対45nmでマイクロアーキテクチャも後発という2重のアドバンテージがある
(もちろんOpteron 61xxにもAVXは未実装という)状況下で、いい勝負。
おまけで補足。
(といっても御覧のありさまなので、興味のある人は自分で調べてください)
アーキテクチャごとに2行データがあるのは
上段がTOP500での最上位のスコアで、下段がもっとも効率が良いもののスコア。(のはず)
Opteron 61xxが3行あるのは3位の次点のデータを示すため。
Tesla 20x0の5位があるのは親コメントに含まれるため。
(元々親コメントが「8位よりも効率の悪い3位のデータと2位よりも順位の低い5位」を比べている違和感で調べ始めた)
Tesla 20x0の21位があるのは消し忘れ。(5位から21位を抽出して見比べていた)
Bulldozerが1行しかないのは消費電力があるデータが1つしかないから。
ShenWeiが1行しかないのはそもそも1つしかランクインしてないから。
Re:バカでした。 (スコア:1)
元コメの者です。
特に深い意味はありません。
元々、国産同士の比較の方がなじみがあってわかりやすいだろうと、京とTSUBAMEの数字を出してみたら、電力効率がほとんど同じだったものだから、しかたなくTOP500を眺めてx86なスパコンの数字も出してみた、って流れです。
(最初はTOP500も見ずに個別のスペック情報で書いてました。それよりはTOP500のリンクの方が統一的なフォーマットでわかりやすいだろうと後から修正。)