アカウント名:
パスワード:
ベクトル演算器といっても2とかそこいらの短いベクトルですよね。 命令供給の帯域を減らし、 命令スケジュールを簡略化する辺りを狙っていると考えれば、 あとはふつうに疑似ベクトル処理と考えればいいんじゃないですか。
長さたった2のベクトルでさえ わざわざ命令を追加してきたということは、 疑似ベクトルするのに命令供給が追いつかなかったとか そういった定量的根拠があるはずで。
で、データ供給のためにメモリ帯域が必要なのはその通りです。
だから、少しでもメモリ帯域のましな、 2~4バンク程度のインタリーブしてる機種を 選んでるでしょうし、 限られた条件下で実現できるDDR-SDRAMのバースト転送レートと プリフェッチも駆使するでしょうから、 あとはたとえばキャッシュサイズ境界で ストリップマイニングやブロック分割アルゴリズムを考えるなり、 メモリの遅さを隠蔽するチューニングを頑張ってると 考えていいんじゃないですか。
ベクトルスーパーコンピュータ並みに多バンクのSRAMで主記憶を 組めばそりゃ速いけどそれじゃ高くつくから我慢、ってのが コモディティクラスタなわけで、 そこでいろいろと苦労して出ない性能をひねり出したり あるところで割り切って我慢したりする必要があるのは 織り込み済みじゃないかと。
疑似ベクトルするのに命令供給が追いつかなかった
メモリの遅さを隠蔽するチューニングを頑張ってる
ベクトルスーパーコンピュータ並みに多バンクのSRAMで主記憶を組めばそりゃ速いけどそれじゃ高くつくから我慢、ってのがコモディティクラスタなわけ
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
「科学者は100%安全だと保証できないものは動かしてはならない」、科学者「えっ」、プログラマ「えっ」
キャッシュベース (スコア:1)
最低限、キャッシュメモリにプリフェッチ命令と広帯域で多バンクのメモリが必要だと思う。
Re:キャッシュベース (スコア:3, 興味深い)
ベクトル演算器といっても2とかそこいらの短いベクトルですよね。 命令供給の帯域を減らし、 命令スケジュールを簡略化する辺りを狙っていると考えれば、 あとはふつうに疑似ベクトル処理と考えればいいんじゃないですか。
長さたった2のベクトルでさえ わざわざ命令を追加してきたということは、 疑似ベクトルするのに命令供給が追いつかなかったとか そういった定量的根拠があるはずで。
で、データ供給のためにメモリ帯域が必要なのはその通りです。
だから、少しでもメモリ帯域のましな、 2~4バンク程度のインタリーブしてる機種を 選んでるでしょうし、 限られた条件下で実現できるDDR-SDRAMのバースト転送レートと プリフェッチも駆使するでしょうから、 あとはたとえばキャッシュサイズ境界で ストリップマイニングやブロック分割アルゴリズムを考えるなり、 メモリの遅さを隠蔽するチューニングを頑張ってると 考えていいんじゃないですか。
ベクトルスーパーコンピュータ並みに多バンクのSRAMで主記憶を 組めばそりゃ速いけどそれじゃ高くつくから我慢、ってのが コモディティクラスタなわけで、 そこでいろいろと苦労して出ない性能をひねり出したり あるところで割り切って我慢したりする必要があるのは 織り込み済みじゃないかと。
Re:キャッシュベース (スコア:1)