アカウント名:
パスワード:
マザーボードのファームウェア更新で解消したとか、メモリ設定を正しく読めていなかったことが原因とか、マザーボードの設定をAMDのサポートの指示通りに変更すると、パフォーマンスが大幅に落ちるが解消するとかいう話が出てました。動作保証できない条件で出荷していたのか、単に後から問題が見つかったのか。個人では速くてちゃんと動けばなんでもいいんですけどね。
> 個人では速くてちゃんと動けばなんでもいいんですけどね。 ちなみに法人でもそうです。
ネットイナゴとしては大いにけしからん、的な
ネットイナゴって何だっけ?
法人によっては、時間や権威による保証が要求されるんじゃないか?
そんな用途はサーバーとかに載っている一部だけで、ほとんどはプレゼン資料の作成とか業務用システムの端末ソフトが動けばいいというものだと思う。
そんな用途ならSEGVが出ることもないのでは。Windowsでは発生しないそうだし。
> ちゃんと動けば
AMDのサポートの指示通りに変更しても解決しないという話も出てました
出荷テストで遅延故障を落とせなかったのかもね。それで追加のテストパタンで不良品をリジェクトしたと。
追加のテストパターンはカーネルコンパイルです!だったりして。
いや、割とそれマジな話っぽいぜ。メモリの話だけどmemtest86のテストなんてヌルゲーで、ガチテストは prime95かカーネルコンパイルってのはちょくちょく聞く話だ。
いわゆるBOST(built-out self-test)って奴ね。ROMをくっつけて、カーネルコンパイルほどでは無いにしてもエラーを起こすプログラムを実行して選別する。
運用でカバー
個人的にはStepping B2のRyzen待ちですね。その頃には値段もこなれてくるだろうし。
日本の場合はASK次第です。
Z87の時は新ステップ出回るまでに時間が掛かったっけなぁ。自分のところの旧ステップ在庫が全部捌けるまで新ステップの出荷をしなかったんだろうな。代理店によっても差はあるでしょうが、海外より1~2カ月も遅かった。日本は海外より割高なうえにこんな調子。
日本AMDが代理店丸投げでIntelのように協力的では無いからね。仕方ないね。# それでも今更Intelプラットフォームには移れない…
再現試験だとメモリの設定を手動で緩めたら解消したという報告が多い(というかメモリ設定を緩めても再現した報告あるのかな?)のでB1ステッピングのメモリ周りがシビアすぎる&初期のファームウェアがメモリチップの検出に失敗して結果としてメモリをOC設定してしまうの合わせ技っぽい感じですね。B2の改良もコアではなくメモコンって話ですし。
なのでメモリ設定を手動で緩めると直る→実はそれが自動検出されているべき本来の正しい設定なので直るファーム更新すると直る→メモリが本来の(遅い)設定になるので直るB2で直る→メモコンの改善で多少無理が利くようになったということかと。
> (というかメモリ設定を緩めても再現した報告あるのかな?)
緩めても再現してますね。
https://twitter.com/ruby_U/status/885465722612142080 [twitter.com]> #Ryzen_SEGV_Battle メモリタイミングを https://gist.github.com/rubyu/d45082932da1e7b7a0de6bf9e4c159df [github.com] … に固定してbtfs-progsを48時間で20977回コンパイルしてエラーなし。以前はどうしても数回エラーが出てた。参考: http://egg.2ch.net/test/read.cgi/ [2ch.net]
と、メモリ設定緩めると直ったかと思いきや...
https://twitter.com/ruby_U/status/885589846726660096 [twitter.com]> 25000時点で1個エラーが…。ダメかー
https://twitter.com/ruby_U/status/886018801673715712 [twitter.com]> さらにメモリ設定を緩めてテスト。18-18-18-39。Advanced->DRAM Timing...から設定。参考 https://egg.2ch.net/test/read.cgi/jisaku/1495164659/564 [2ch.net]
https://twitter.com/ruby_U/status/886907612620509185 [twitter.com]> 実はこの後エラーが出ました(約4万回で1エラー)。どうしようもないなーと思いRMA手続き中です。最初からRMAの話をしたせいか、AMDから回避策の話はなかったので私見ですが、メモリタイミングより電圧盛りのほうが効果はありそうな気がしてます。AMDに指示を仰いでみてはどうでしょうか
というわけで、メモリ設定を緩めると頻度が下がるものの、解決するわけではないということでした。twitterで情報交換してた人達の間では、この 7月13日から17日くらいに、この話は知れ渡ってましたね。
twitter以外で情報集めてた人は、こういう話を知らなかったんでしょうか...
個体差によっては定格ですらキツイ奴がいるし、古いBIOSがバグでOC設定しやがるからメモリ壊す可能性もあるし、でもまあメモコンの耐性がカツカツなのが問題なのでとにかくメモリを緩めれば状況は大きく緩和するAMDもそれを認識してるからB2ステップでメモコン改善しますって話でしょそれを変な「検証」をして延々コアの問題だと主張する人がいるから話がややこしくなった
Twitter で情報を集めていた人は、海外のサイトを見ていない気がしますね。
メモリタイミングだけではなく、μ opcache も disable にしないと、解決しないとのこと。とどのつまりウェハーの製造工程と QA に問題があったのでしょう。今 RMA で返ってきているのは、製造週が最近の物。
あと、RMA で直るのは「セグメンテーションフォルトが出なくなるだけ」で、%rip register (Instruction Pointer) が違う場所を指し示す問題は直らないというのが既に検証されているので、注意が必要ですね。
こちらについては、
https://community.amd.com/thread/215773?start=691 [amd.com] https://community.amd.com/thread/215773?start=694 [amd.com] https://community.amd.com/thread/215773?start=711 [amd.com] - 713
程まで。
問題点は、この辺を読むと分かるでしょう
> そこのtwitterあてにならないよ> BIOS変えないし
デマを流して ruby_U さんを中傷するのはやめてください。上で引用されているメモリタイミングの変更は 7月中旬ですが、それ以前にちゃんと BIOS を更新しています。以下参照。
5月2日 https://twitter.com/ruby_U/status/859353036296249344 [twitter.com] > BIOSとチップセットドライバを最新に上げて、3.5GHzで運用してみる
6月9日
メモリタイミングを見直すのとuop cache無効でほとんど起きなくなったけど
それ致命的な性能低下に繋がるよね。インテルもそうだがどうせAMDはリコールしないんだろうけど。
要は性能を落としたら安定しましたという風にも言えることですよね。μOPキャッシュの無効化ってさらっと書きますよねえ。元ACさんは不誠実と言わざるを得ない。
原因の切り分けをするためにμOPキャッシュを無効にしたという話だろ。AMDが回避策としてμOPキャッシュをoffにしろと言ったわけでもないのに何が不誠実なんだ?
元コメントからそれが読み取れると仰る?
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
UNIXはシンプルである。必要なのはそのシンプルさを理解する素質だけである -- Dennis Ritchie
一部ではBIOS更新で解消したとか (スコア:2)
マザーボードのファームウェア更新で解消したとか、メモリ設定を正しく読めていなかったことが原因とか、マザーボードの設定を
AMDのサポートの指示通りに変更すると、パフォーマンスが大幅に落ちるが解消するとかいう話が出てました。
動作保証できない条件で出荷していたのか、単に後から問題が見つかったのか。個人では速くてちゃんと動けばなんでもいいんですけどね。
Re:一部ではBIOS更新で解消したとか (スコア:4, すばらしい洞察)
> 個人では速くてちゃんと動けばなんでもいいんですけどね。
ちなみに法人でもそうです。
Re:一部ではBIOS更新で解消したとか (スコア:2, おもしろおかしい)
ネットイナゴとしては大いにけしからん、的な
Re: (スコア:0)
ネットイナゴって何だっけ?
Re:一部ではBIOS更新で解消したとか (スコア:1)
法人によっては、時間や権威による保証が要求されるんじゃないか?
Re: (スコア:0)
そんな用途はサーバーとかに載っている一部だけで、ほとんどはプレゼン資料の作成とか業務用システムの端末ソフトが動けばいいというものだと思う。
Re: (スコア:0)
そんな用途ならSEGVが出ることもないのでは。Windowsでは発生しないそうだし。
Re: (スコア:0)
> ちゃんと動けば
Re: (スコア:0)
AMDのサポートの指示通りに変更しても解決しないという話も出てました
Re: (スコア:0)
出荷テストで遅延故障を落とせなかったのかもね。
それで追加のテストパタンで不良品をリジェクトしたと。
Re: (スコア:0)
追加のテストパターンはカーネルコンパイルです!
だったりして。
Re: (スコア:0)
いや、割とそれマジな話っぽいぜ。
メモリの話だけどmemtest86のテストなんてヌルゲーで、ガチテストは prime95かカーネルコンパイルってのはちょくちょく聞く話だ。
Re: (スコア:0)
いわゆるBOST(built-out self-test)って奴ね。
ROMをくっつけて、カーネルコンパイルほどでは無いにしてもエラーを起こすプログラムを実行して選別する。
Re: (スコア:0)
運用でカバー
Re: (スコア:0)
個人的にはStepping B2のRyzen待ちですね。
その頃には値段もこなれてくるだろうし。
Re:一部ではBIOS更新で解消したとか (スコア:1)
日本の場合はASK次第です。
Re: (スコア:0)
Z87の時は新ステップ出回るまでに時間が掛かったっけなぁ。
自分のところの旧ステップ在庫が全部捌けるまで新ステップの出荷をしなかったんだろうな。
代理店によっても差はあるでしょうが、海外より1~2カ月も遅かった。
日本は海外より割高なうえにこんな調子。
Re:一部ではBIOS更新で解消したとか (スコア:1)
日本AMDが代理店丸投げでIntelのように協力的では無いからね。仕方ないね。
# それでも今更Intelプラットフォームには移れない…
Re: (スコア:0)
再現試験だとメモリの設定を手動で緩めたら解消したという報告が多い(というかメモリ設定を緩めても再現した報告あるのかな?)ので
B1ステッピングのメモリ周りがシビアすぎる&初期のファームウェアがメモリチップの検出に失敗して結果としてメモリをOC設定してしまう
の合わせ技っぽい感じですね。
B2の改良もコアではなくメモコンって話ですし。
なので
メモリ設定を手動で緩めると直る→実はそれが自動検出されているべき本来の正しい設定なので直る
ファーム更新すると直る→メモリが本来の(遅い)設定になるので直る
B2で直る→メモコンの改善で多少無理が利くようになった
ということかと。
Re:一部ではBIOS更新で解消したとか (スコア:2, 興味深い)
> (というかメモリ設定を緩めても再現した報告あるのかな?)
緩めても再現してますね。
https://twitter.com/ruby_U/status/885465722612142080 [twitter.com]
> #Ryzen_SEGV_Battle メモリタイミングを https://gist.github.com/rubyu/d45082932da1e7b7a0de6bf9e4c159df [github.com] … に固定してbtfs-progsを48時間で20977回コンパイルしてエラーなし。以前はどうしても数回エラーが出てた。参考: http://egg.2ch.net/test/read.cgi/ [2ch.net]
と、メモリ設定緩めると直ったかと思いきや...
https://twitter.com/ruby_U/status/885589846726660096 [twitter.com]
> 25000時点で1個エラーが…。ダメかー
https://twitter.com/ruby_U/status/886018801673715712 [twitter.com]
> さらにメモリ設定を緩めてテスト。18-18-18-39。Advanced->DRAM Timing...から設定。参考 https://egg.2ch.net/test/read.cgi/jisaku/1495164659/564 [2ch.net]
https://twitter.com/ruby_U/status/886907612620509185 [twitter.com]
> 実はこの後エラーが出ました(約4万回で1エラー)。どうしようもないなーと思いRMA手続き中です。最初からRMAの話をしたせいか、AMDから回避策の話はなかったので私見ですが、メモリタイミングより電圧盛りのほうが効果はありそうな気がしてます。AMDに指示を仰いでみてはどうでしょうか
というわけで、メモリ設定を緩めると頻度が下がるものの、解決するわけではないということでした。
twitterで情報交換してた人達の間では、この 7月13日から17日くらいに、この話は知れ渡ってましたね。
twitter以外で情報集めてた人は、こういう話を知らなかったんでしょうか...
Re: (スコア:0)
個体差によっては定格ですらキツイ奴がいるし、古いBIOSがバグでOC設定しやがるからメモリ壊す可能性もあるし、でもまあメモコンの耐性がカツカツなのが問題なのでとにかくメモリを緩めれば状況は大きく緩和する
AMDもそれを認識してるからB2ステップでメモコン改善しますって話でしょ
それを変な「検証」をして延々コアの問題だと主張する人がいるから話がややこしくなった
Re: (スコア:0)
Twitter で情報を集めていた人は、海外のサイトを見ていない気がしますね。
メモリタイミングだけではなく、μ opcache も disable にしないと、解決しないとのこと。
とどのつまりウェハーの製造工程と QA に問題があったのでしょう。今 RMA で返ってきているのは、製造週が最近の物。
あと、RMA で直るのは「セグメンテーションフォルトが出なくなるだけ」で、%rip register (Instruction Pointer) が
違う場所を指し示す問題は直らないというのが既に検証されているので、注意が必要ですね。
こちらについては、
https://community.amd.com/thread/215773?start=691 [amd.com]
https://community.amd.com/thread/215773?start=694 [amd.com]
https://community.amd.com/thread/215773?start=711 [amd.com] - 713
程まで。
問題点は、この辺を読むと分かるでしょう
Re: (スコア:0)
> そこのtwitterあてにならないよ
> BIOS変えないし
デマを流して ruby_U さんを中傷するのはやめてください。
上で引用されているメモリタイミングの変更は 7月中旬ですが、
それ以前にちゃんと BIOS を更新しています。以下参照。
5月2日
https://twitter.com/ruby_U/status/859353036296249344 [twitter.com]
> BIOSとチップセットドライバを最新に上げて、3.5GHzで運用してみる
6月9日
Re: (スコア:0)
メモリタイミングを見直すのとuop cache無効でほとんど起きなくなったけど
それ致命的な性能低下に繋がるよね。インテルもそうだがどうせAMDはリコールしないんだろうけど。
Re:一部ではBIOS更新で解消したとか (スコア:2)
要は性能を落としたら安定しましたという風にも言えることですよね。
μOPキャッシュの無効化ってさらっと書きますよねえ。元ACさんは不誠実と言わざるを得ない。
Re: (スコア:0)
原因の切り分けをするためにμOPキャッシュを無効にしたという話だろ。
AMDが回避策としてμOPキャッシュをoffにしろと言ったわけでもないのに何が不誠実なんだ?
Re:一部ではBIOS更新で解消したとか (スコア:2)
元コメントからそれが読み取れると仰る?