アカウント名:
パスワード:
>10nmは低消費電力にフォーカスしており、演算性能自体は14nm++の方が高い周波数が上げられないという事かな?Caffe lakeは熱的条件が厳しので、シングルスレッド性能を犠牲にしてでもRyzen同様8コア積んで貰えれば、それで十分だと思う。7nmのZen2が控えているので、Intelもぱっと花を咲かせて貰いたいところ。
コアが増えて性能が上がるならいいが、今でもコアの負荷が100%になることはなくて、よくて2コアで50%ぐらいなんだよね。しかも4コアに比べて8コアが性能2倍になるかといえば、メモリ帯域を食い合うので、そんなことはない。
逆に言うとトランジスタは余っているので、コア数減らして、その分、シングルスレッド上げてほしい。それができないからコア数を増やしているんだろうし、単純にキャッシュをこれ以上増やしても性能上がらないし、となるとAES-NIのような専用回路を増やすしかないのかもしれない。でも専用回路で性能を上げる処理もネタ切れなんだろう。
個人的には、x86でないコアも載せて、新しいソフトは新コア、古いソフトはx86コアにしてほしいけど、最初は使われない新コア分はまるまる無駄だから、そんなことしないよなあ。デコーダだけ二つ用意して、切り替えるという手もあるが、デコーダはクリティカルパスだろうし、そんなこと無理か。
今日のプロセッサは(2次)キャッシュミスが律速しているのでシングルスレッド性能を上げるのは難しいキャッシュにデータが載ってなければどうしようもないので、容量を増やすか賢くプリフェッチするしかないが、前者はすでに最適化されている
PC用途の場合、現時点でもキャッシュのヒット率は高い。
R3000での調査によると、100%ヒットする魔法のキャッシュがあったとしても、性能向上は68%でしかない。PentiumM発表時の情報によるとデータミスでCPU動作時間の20%がデータミスで失われているらしい。この場合、100%ヒットするキャッシュがあっても、25%しか性能向上しない。
なのでキャッシュでの性能向上の余地はあまりない。
実行モデルも知らずに数字を出しても意味がない
演算器の数を増やしても並列性を抽出できなければ意味がないが、今のプロセッサはそろそろその上限に近づいている分岐予測はとても効率が良くなった残るはキャッシュだが、これは昔からメカニズムも変わっていないし足を引っ張り続けている自動プリフェッチは分岐予測ほど賢くはないとにかくキャッシュ(とプリフェッチ)以外はできることをやりつくした感があるね無限の演算器と100%あたるキャッシュがあったところで、非数値計算であれば内在する並列度は5-10命令と言われているので、アグレッシブな投機実行をしない限りはそこまで
キャッシュの効率を上げたいなら、まずマルチタスクを止めることだな。OSもノンプリエンティティブなやつにして、カーネルなどが定期的にキャッシュを使用してしまうことを防ぐのがいい。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
Stay hungry, Stay foolish. -- Steven Paul Jobs
マルチスレッド性能の時代 (スコア:1)
>10nmは低消費電力にフォーカスしており、演算性能自体は14nm++の方が高い
周波数が上げられないという事かな?Caffe lakeは熱的条件が厳しので、シングルスレッド性能を犠牲にしてでもRyzen同様8コア積んで貰えれば、それで十分だと思う。
7nmのZen2が控えているので、Intelもぱっと花を咲かせて貰いたいところ。
Re: (スコア:0)
コアが増えて性能が上がるならいいが、今でもコアの負荷が100%になることはなくて、よくて2コアで50%ぐらいなんだよね。
しかも4コアに比べて8コアが性能2倍になるかといえば、メモリ帯域を食い合うので、そんなことはない。
逆に言うとトランジスタは余っているので、コア数減らして、その分、シングルスレッド上げてほしい。
それができないからコア数を増やしているんだろうし、単純にキャッシュをこれ以上増やしても性能上がらないし、となるとAES-NIのような専用回路を増やすしかないのかもしれない。
でも専用回路で性能を上げる処理もネタ切れなんだろう。
個人的には、x86でないコアも載せて、新しいソフトは新コア、古いソフトはx86コアにしてほしいけど、最初は使われない新コア分はまるまる無駄だから、そんなことしないよなあ。
デコーダだけ二つ用意して、切り替えるという手もあるが、デコーダはクリティカルパスだろうし、そんなこと無理か。
Re: (スコア:0)
今日のプロセッサは(2次)キャッシュミスが律速しているのでシングルスレッド性能を上げるのは難しい
キャッシュにデータが載ってなければどうしようもないので、容量を増やすか賢くプリフェッチするしかないが、前者はすでに最適化されている
Re:マルチスレッド性能の時代 (スコア:0)
PC用途の場合、現時点でもキャッシュのヒット率は高い。
R3000での調査によると、100%ヒットする魔法のキャッシュがあったとしても、性能向上は68%でしかない。
PentiumM発表時の情報によるとデータミスでCPU動作時間の20%がデータミスで失われているらしい。この場合、100%ヒットするキャッシュがあっても、25%しか性能向上しない。
なのでキャッシュでの性能向上の余地はあまりない。
Re: (スコア:0)
実行モデルも知らずに数字を出しても意味がない
演算器の数を増やしても並列性を抽出できなければ意味がないが、今のプロセッサはそろそろその上限に近づいている
分岐予測はとても効率が良くなった
残るはキャッシュだが、これは昔からメカニズムも変わっていないし足を引っ張り続けている
自動プリフェッチは分岐予測ほど賢くはない
とにかくキャッシュ(とプリフェッチ)以外はできることをやりつくした感があるね
無限の演算器と100%あたるキャッシュがあったところで、非数値計算であれば内在する並列度は5-10命令と言われているので、アグレッシブな投機実行をしない限りはそこまで
Re: (スコア:0)
キャッシュの効率を上げたいなら、まずマルチタスクを止めることだな。
OSもノンプリエンティティブなやつにして、カーネルなどが定期的にキャッシュを使用してしまうことを防ぐのがいい。