パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

AMDがRyzenのSEGV問題を認める。」記事へのコメント

  • マザーボードのファームウェア更新で解消したとか、メモリ設定を正しく読めていなかったことが原因とか、マザーボードの設定を
    AMDのサポートの指示通りに変更すると、パフォーマンスが大幅に落ちるが解消するとかいう話が出てました。
    動作保証できない条件で出荷していたのか、単に後から問題が見つかったのか。個人では速くてちゃんと動けばなんでもいいんですけどね。

    • by Anonymous Coward on 2017年08月09日 22時17分 (#3258918)

      再現試験だとメモリの設定を手動で緩めたら解消したという報告が多い(というかメモリ設定を緩めても再現した報告あるのかな?)ので
      B1ステッピングのメモリ周りがシビアすぎる&初期のファームウェアがメモリチップの検出に失敗して結果としてメモリをOC設定してしまう
      の合わせ技っぽい感じですね。
      B2の改良もコアではなくメモコンって話ですし。

      なので
      メモリ設定を手動で緩めると直る→実はそれが自動検出されているべき本来の正しい設定なので直る
      ファーム更新すると直る→メモリが本来の(遅い)設定になるので直る
      B2で直る→メモコンの改善で多少無理が利くようになった
      ということかと。

      親コメント
      • by Anonymous Coward on 2017年08月10日 0時59分 (#3258978)

        > (というかメモリ設定を緩めても再現した報告あるのかな?)

        緩めても再現してますね。

        https://twitter.com/ruby_U/status/885465722612142080 [twitter.com]
        > #Ryzen_SEGV_Battle メモリタイミングを https://gist.github.com/rubyu/d45082932da1e7b7a0de6bf9e4c159df [github.com] … に固定してbtfs-progsを48時間で20977回コンパイルしてエラーなし。以前はどうしても数回エラーが出てた。参考: http://egg.2ch.net/test/read.cgi/ [2ch.net]

        と、メモリ設定緩めると直ったかと思いきや...

        https://twitter.com/ruby_U/status/885589846726660096 [twitter.com]
        > 25000時点で1個エラーが…。ダメかー

        https://twitter.com/ruby_U/status/886018801673715712 [twitter.com]
        > さらにメモリ設定を緩めてテスト。18-18-18-39。Advanced->DRAM Timing...から設定。参考 https://egg.2ch.net/test/read.cgi/jisaku/1495164659/564 [2ch.net]

        https://twitter.com/ruby_U/status/886907612620509185 [twitter.com]
        > 実はこの後エラーが出ました(約4万回で1エラー)。どうしようもないなーと思いRMA手続き中です。最初からRMAの話をしたせいか、AMDから回避策の話はなかったので私見ですが、メモリタイミングより電圧盛りのほうが効果はありそうな気がしてます。AMDに指示を仰いでみてはどうでしょうか

        というわけで、メモリ設定を緩めると頻度が下がるものの、解決するわけではないということでした。
        twitterで情報交換してた人達の間では、この 7月13日から17日くらいに、この話は知れ渡ってましたね。

        twitter以外で情報集めてた人は、こういう話を知らなかったんでしょうか...

        親コメント
        • by Anonymous Coward

          個体差によっては定格ですらキツイ奴がいるし、古いBIOSがバグでOC設定しやがるからメモリ壊す可能性もあるし、でもまあメモコンの耐性がカツカツなのが問題なのでとにかくメモリを緩めれば状況は大きく緩和する
          AMDもそれを認識してるからB2ステップでメモコン改善しますって話でしょ
          それを変な「検証」をして延々コアの問題だと主張する人がいるから話がややこしくなった

        • by Anonymous Coward

          Twitter で情報を集めていた人は、海外のサイトを見ていない気がしますね。

          メモリタイミングだけではなく、μ opcache も disable にしないと、解決しないとのこと。
          とどのつまりウェハーの製造工程と QA に問題があったのでしょう。今 RMA で返ってきているのは、製造週が最近の物。

          あと、RMA で直るのは「セグメンテーションフォルトが出なくなるだけ」で、%rip register (Instruction Pointer) が
          違う場所を指し示す問題は直らないというのが既に検証されているので、注意が必要ですね。

          こちらについては、

          https://community.amd.com/thread/215773?start=691 [amd.com]
          https://community.amd.com/thread/215773?start=694 [amd.com]
          https://community.amd.com/thread/215773?start=711 [amd.com] - 713

          程まで。

          問題点は、この辺を読むと分かるでしょう

犯人は巨人ファンでA型で眼鏡をかけている -- あるハッカー

処理中...