アカウント名:
パスワード:
マザーボードのファームウェア更新で解消したとか、メモリ設定を正しく読めていなかったことが原因とか、マザーボードの設定をAMDのサポートの指示通りに変更すると、パフォーマンスが大幅に落ちるが解消するとかいう話が出てました。動作保証できない条件で出荷していたのか、単に後から問題が見つかったのか。個人では速くてちゃんと動けばなんでもいいんですけどね。
再現試験だとメモリの設定を手動で緩めたら解消したという報告が多い(というかメモリ設定を緩めても再現した報告あるのかな?)のでB1ステッピングのメモリ周りがシビアすぎる&初期のファームウェアがメモリチップの検出に失敗して結果としてメモリをOC設定してしまうの合わせ技っぽい感じですね。B2の改良もコアではなくメモコンって話ですし。
なのでメモリ設定を手動で緩めると直る→実はそれが自動検出されているべき本来の正しい設定なので直るファーム更新すると直る→メモリが本来の(遅い)設定になるので直るB2で直る→メモコンの改善で多少無理が利くようになったということかと。
> (というかメモリ設定を緩めても再現した報告あるのかな?)
緩めても再現してますね。
https://twitter.com/ruby_U/status/885465722612142080 [twitter.com]> #Ryzen_SEGV_Battle メモリタイミングを https://gist.github.com/rubyu/d45082932da1e7b7a0de6bf9e4c159df [github.com] … に固定してbtfs-progsを48時間で20977回コンパイルしてエラーなし。以前はどうしても数回エラーが出てた。参考: http://egg.2ch.net/test/read.cgi/ [2ch.net]
と、メモリ設定緩めると直ったかと思いきや...
https://twitter.com/ruby_U/status/885589846726660096 [twitter.com]> 25000時点で1個エラーが…。ダメかー
https://twitter.com/ruby_U/status/886018801673715712 [twitter.com]> さらにメモリ設定を緩めてテスト。18-18-18-39。Advanced->DRAM Timing...から設定。参考 https://egg.2ch.net/test/read.cgi/jisaku/1495164659/564 [2ch.net]
https://twitter.com/ruby_U/status/886907612620509185 [twitter.com]> 実はこの後エラーが出ました(約4万回で1エラー)。どうしようもないなーと思いRMA手続き中です。最初からRMAの話をしたせいか、AMDから回避策の話はなかったので私見ですが、メモリタイミングより電圧盛りのほうが効果はありそうな気がしてます。AMDに指示を仰いでみてはどうでしょうか
というわけで、メモリ設定を緩めると頻度が下がるものの、解決するわけではないということでした。twitterで情報交換してた人達の間では、この 7月13日から17日くらいに、この話は知れ渡ってましたね。
twitter以外で情報集めてた人は、こういう話を知らなかったんでしょうか...
個体差によっては定格ですらキツイ奴がいるし、古いBIOSがバグでOC設定しやがるからメモリ壊す可能性もあるし、でもまあメモコンの耐性がカツカツなのが問題なのでとにかくメモリを緩めれば状況は大きく緩和するAMDもそれを認識してるからB2ステップでメモコン改善しますって話でしょそれを変な「検証」をして延々コアの問題だと主張する人がいるから話がややこしくなった
Twitter で情報を集めていた人は、海外のサイトを見ていない気がしますね。
メモリタイミングだけではなく、μ opcache も disable にしないと、解決しないとのこと。とどのつまりウェハーの製造工程と QA に問題があったのでしょう。今 RMA で返ってきているのは、製造週が最近の物。
あと、RMA で直るのは「セグメンテーションフォルトが出なくなるだけ」で、%rip register (Instruction Pointer) が違う場所を指し示す問題は直らないというのが既に検証されているので、注意が必要ですね。
こちらについては、
https://community.amd.com/thread/215773?start=691 [amd.com] https://community.amd.com/thread/215773?start=694 [amd.com] https://community.amd.com/thread/215773?start=711 [amd.com] - 713
程まで。
問題点は、この辺を読むと分かるでしょう
> そこのtwitterあてにならないよ> BIOS変えないし
デマを流して ruby_U さんを中傷するのはやめてください。上で引用されているメモリタイミングの変更は 7月中旬ですが、それ以前にちゃんと BIOS を更新しています。以下参照。
5月2日 https://twitter.com/ruby_U/status/859353036296249344 [twitter.com] > BIOSとチップセットドライバを最新に上げて、3.5GHzで運用してみる
6月9日
メモリタイミングを見直すのとuop cache無効でほとんど起きなくなったけど
それ致命的な性能低下に繋がるよね。インテルもそうだがどうせAMDはリコールしないんだろうけど。
要は性能を落としたら安定しましたという風にも言えることですよね。μOPキャッシュの無効化ってさらっと書きますよねえ。元ACさんは不誠実と言わざるを得ない。
原因の切り分けをするためにμOPキャッシュを無効にしたという話だろ。AMDが回避策としてμOPキャッシュをoffにしろと言ったわけでもないのに何が不誠実なんだ?
元コメントからそれが読み取れると仰る?
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
犯人は巨人ファンでA型で眼鏡をかけている -- あるハッカー
一部ではBIOS更新で解消したとか (スコア:2)
マザーボードのファームウェア更新で解消したとか、メモリ設定を正しく読めていなかったことが原因とか、マザーボードの設定を
AMDのサポートの指示通りに変更すると、パフォーマンスが大幅に落ちるが解消するとかいう話が出てました。
動作保証できない条件で出荷していたのか、単に後から問題が見つかったのか。個人では速くてちゃんと動けばなんでもいいんですけどね。
Re:一部ではBIOS更新で解消したとか (スコア:0)
再現試験だとメモリの設定を手動で緩めたら解消したという報告が多い(というかメモリ設定を緩めても再現した報告あるのかな?)ので
B1ステッピングのメモリ周りがシビアすぎる&初期のファームウェアがメモリチップの検出に失敗して結果としてメモリをOC設定してしまう
の合わせ技っぽい感じですね。
B2の改良もコアではなくメモコンって話ですし。
なので
メモリ設定を手動で緩めると直る→実はそれが自動検出されているべき本来の正しい設定なので直る
ファーム更新すると直る→メモリが本来の(遅い)設定になるので直る
B2で直る→メモコンの改善で多少無理が利くようになった
ということかと。
Re:一部ではBIOS更新で解消したとか (スコア:2, 興味深い)
> (というかメモリ設定を緩めても再現した報告あるのかな?)
緩めても再現してますね。
https://twitter.com/ruby_U/status/885465722612142080 [twitter.com]
> #Ryzen_SEGV_Battle メモリタイミングを https://gist.github.com/rubyu/d45082932da1e7b7a0de6bf9e4c159df [github.com] … に固定してbtfs-progsを48時間で20977回コンパイルしてエラーなし。以前はどうしても数回エラーが出てた。参考: http://egg.2ch.net/test/read.cgi/ [2ch.net]
と、メモリ設定緩めると直ったかと思いきや...
https://twitter.com/ruby_U/status/885589846726660096 [twitter.com]
> 25000時点で1個エラーが…。ダメかー
https://twitter.com/ruby_U/status/886018801673715712 [twitter.com]
> さらにメモリ設定を緩めてテスト。18-18-18-39。Advanced->DRAM Timing...から設定。参考 https://egg.2ch.net/test/read.cgi/jisaku/1495164659/564 [2ch.net]
https://twitter.com/ruby_U/status/886907612620509185 [twitter.com]
> 実はこの後エラーが出ました(約4万回で1エラー)。どうしようもないなーと思いRMA手続き中です。最初からRMAの話をしたせいか、AMDから回避策の話はなかったので私見ですが、メモリタイミングより電圧盛りのほうが効果はありそうな気がしてます。AMDに指示を仰いでみてはどうでしょうか
というわけで、メモリ設定を緩めると頻度が下がるものの、解決するわけではないということでした。
twitterで情報交換してた人達の間では、この 7月13日から17日くらいに、この話は知れ渡ってましたね。
twitter以外で情報集めてた人は、こういう話を知らなかったんでしょうか...
Re: (スコア:0)
個体差によっては定格ですらキツイ奴がいるし、古いBIOSがバグでOC設定しやがるからメモリ壊す可能性もあるし、でもまあメモコンの耐性がカツカツなのが問題なのでとにかくメモリを緩めれば状況は大きく緩和する
AMDもそれを認識してるからB2ステップでメモコン改善しますって話でしょ
それを変な「検証」をして延々コアの問題だと主張する人がいるから話がややこしくなった
Re: (スコア:0)
Twitter で情報を集めていた人は、海外のサイトを見ていない気がしますね。
メモリタイミングだけではなく、μ opcache も disable にしないと、解決しないとのこと。
とどのつまりウェハーの製造工程と QA に問題があったのでしょう。今 RMA で返ってきているのは、製造週が最近の物。
あと、RMA で直るのは「セグメンテーションフォルトが出なくなるだけ」で、%rip register (Instruction Pointer) が
違う場所を指し示す問題は直らないというのが既に検証されているので、注意が必要ですね。
こちらについては、
https://community.amd.com/thread/215773?start=691 [amd.com]
https://community.amd.com/thread/215773?start=694 [amd.com]
https://community.amd.com/thread/215773?start=711 [amd.com] - 713
程まで。
問題点は、この辺を読むと分かるでしょう
Re: (スコア:0)
> そこのtwitterあてにならないよ
> BIOS変えないし
デマを流して ruby_U さんを中傷するのはやめてください。
上で引用されているメモリタイミングの変更は 7月中旬ですが、
それ以前にちゃんと BIOS を更新しています。以下参照。
5月2日
https://twitter.com/ruby_U/status/859353036296249344 [twitter.com]
> BIOSとチップセットドライバを最新に上げて、3.5GHzで運用してみる
6月9日
Re: (スコア:0)
メモリタイミングを見直すのとuop cache無効でほとんど起きなくなったけど
それ致命的な性能低下に繋がるよね。インテルもそうだがどうせAMDはリコールしないんだろうけど。
Re:一部ではBIOS更新で解消したとか (スコア:2)
要は性能を落としたら安定しましたという風にも言えることですよね。
μOPキャッシュの無効化ってさらっと書きますよねえ。元ACさんは不誠実と言わざるを得ない。
Re: (スコア:0)
原因の切り分けをするためにμOPキャッシュを無効にしたという話だろ。
AMDが回避策としてμOPキャッシュをoffにしろと言ったわけでもないのに何が不誠実なんだ?
Re:一部ではBIOS更新で解消したとか (スコア:2)
元コメントからそれが読み取れると仰る?