パスワードを忘れた? アカウント作成
12404 story

Opteronの一部製品で演算結果に問題が発生する可能性 57

ストーリー by kazekiri
一瞬大事故かと思ったが 部門より

zeroing曰く、"ITmediaの記事によると、AMDOpteronの一部で演算結果に問題が発生する可能性があることを明らかにした。該当するのはシングルコアOpteronのうちクロック周波数が2.6GHzおよび2.8GHzのモデルの初期出荷分で、モデルナンバーは152、252、852、154、254、854。該当製品ではCPUが高温な状態での浮動小数点演算において、「一貫性のない計算結果を示す」可能性がある。該当製品を導入している企業ユーザに対しては既に無償交換等の対応が行われているそうだ。"

MYCOMの記事によれば、特定の条件下で誤動作を起こす可能性があるのは、出荷済みの数百万個のうち3,000個程度であり、発生する可能性も「きわめて低い」とのこと。また個人ユーザへの無償交換対応も行っているようだ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by naruaki (2658) on 2006年04月29日 14時02分 (#930626) 日記
    実際にバグった演算結果を目にしてみたいものだ、
    • 浮動小数点演算なんて誤差が前提のようなものだけど
      さらにとんでもない結果になるのかねぇ
      • by zeroing (30451) on 2006年04月29日 21時04分 (#930781) 日記
        浮動小数点演算なんて誤差が前提のようなものだけど さらにとんでもない結果になるのかねぇ
        浮動小数点演算に誤差がつきものなのは確かですが,それは一貫性があって予測可能なものですから,一貫性のない計算結果を示すということとは全く違う話です.
        親コメント
  • テスト抜け (スコア:3, すばらしい洞察)

    by Anonymous Coward on 2006年04月29日 13時14分 (#930601)
    テスト項目が一部抜けていたため、不具合がある「かもしれない」ユニットを出荷してしまったということですか。
    対象はごく一部のようですし、それも不具合があるとは限らないようですが、それでも回収を決めるとは、なかなかやるな、という感想をもちました。

    しかし、最終的に交換対象かどうかを調べるのに製造番号を調べる必要があると思いますが、すでに稼動しているマシンだとCPUの上にヒートシンクが張り付いていて、確認するのも一苦労なのでは……。
    • Re:テスト抜け (スコア:4, 参考になる)

      by Anonymous Coward on 2006年04月29日 13時24分 (#930606)
      PC Watch [impress.co.jp]によると
      OEMベンダーに対しては、該当するOpteronを識別するためのソフトウェア検証ツールが提供され
      という事ですからヒートシンクをはずさなくても確認できると思いますよ
      でも個人で使っている人は検証ツールが提供されないから無理なのかな?
      それより高熱だと(熱暴走しなくても)計算ミスを起こす可能性があるというのが有用な情報に思います
      親コメント
      • by Anonymous Coward
        >該当するOpteronを識別するためのソフトウェア検証ツールが提供され

        実はAMDもプロセッサシリアルナンバーを採用していたりして



        3)システムが高温化で動作している
        誰か日本語に直していただけませんか
        • by Anonymous Coward

          3)システムが高温化で動作している
          誰か日本語に直していただけませんか

          単純に s/化/下/ ではないかと。

        • by Anonymous Coward
          元の文章は日本語ですので
          正しくは「日本語を直す」ですね:-)
      • by Anonymous Coward
        ソフトウェア検証ツールって何をやっているのかな?

        出荷テストの結果によって何MHzまで動くか分かった実力を
        ソフトで読めるようにしているならともかく、モデルナンバーと
        実際に使われているときの周波数を比較するようなことが
        出来るのだろうか?

        もし、浮動小数点演算の結果をソフトライブラリによる
        演算結果と比較するようなことをしていたら、仕様の最大
        温度で実行させることが難しいだろうし。

        AMDは最大温度を突破させる(通常動作では有り得ない)
        動作方法を知っていて、その動作をさせているのか?
    • Re:テスト抜け (スコア:3, すばらしい洞察)

      by Anonymous Coward on 2006年04月29日 15時11分 (#930645)
      > それでも回収を決めるとは、なかなかやるな、という感想をもちました。

      AthlonならともかくOpteronでこんな不具合があったら、回収しないという選択肢はありえないでしょう。
      親コメント
    • by nezuku (25740) on 2006年04月29日 13時31分 (#930610)
      対象となる個数が少ないとはいえ,即急な対応になるのは
      かつてのPentiumのバグ騒動の恐怖がAMDの脳裏にも有るのでしょうか?

      プライバシー侵害の恐れがあると大騒ぎになった,PentiumIIIの
      プロセッサシリアルナンバーみたいなものがあれば,
      分解しなくても問題を抱えるプロセッサを発見することができるんでしょうけど…

      とはいえあれもデフォルトでは無効になっていて,BIOSで無効化されると
      ソフト設定できないんでしたっけ?
      親コメント
    • by Anonymous Coward on 2006年04月29日 16時50分 (#930674)
      AMDのニュースリリースのベンチマークとはLinpackらしい。

      いまさらLinpackでもないとおもいますが、Opteronはクラスターでよく使われているのでパラレル版かも。top500に出そうと思ったら計算結果が違っていた、、とか

      さあみんなでベンチマーク大会を開き、結果を持ち寄りましょう。一番結果がずれているのが優勝、てどうですか。
      親コメント
  • by Anonymous Coward on 2006年04月29日 18時18分 (#930702)
    あっちは毎回同じマチガイを犯すけど、うちのは毎回演算結果が違うから、検算すればすぐわかることだ。コンピュータの演算は絶対に正しいという思い込みさえなければよいのだ。

    #と逆切れしたら面白いのに
  • CPUの温度計 (スコア:2, 興味深い)

    by zeroing (30451) on 2006年04月29日 18時56分 (#930727) 日記
    昔あるCPUにバグがあって,高温で動作していると浮動小数点数演算結果の下位桁に誤りが混入してくる.それを利用して,誤りの含まれる桁数を数えることでCPUの温度を計るプログラムを作った人がいた,という話があったと思うんですが,あれは何だったでしょうか….
    • Re:CPUの温度計 (スコア:2, 参考になる)

      by Anonymous Coward on 2006年04月30日 1時26分 (#930913)
      その話はたしか、温度が上がると浮動小数点演算ボード
      が熱で変形し、コネクタとの接触が下位桁側から順に
      無くなってくというものだったと思います。

      なので、温度と誤りの混入量に一定の関係が出来るので
      温度を測ることが出来るんだと思います。

      #どこの本で読んだのか忘れてしまったのでAC
      親コメント
      • by Anonymous Coward
        プログラミング作法 [amazon.co.jp]だったと思う。
          # 会社に置きっぱなしで確認できないのでAC
        • Re:CPUの温度計 (スコア:4, 参考になる)

          by zeroing (30451) on 2006年04月30日 22時38分 (#931311) 日記
          その話はたしか、温度が上がると浮動小数点演算ボード
          が熱で変形し、コネクタとの接触が下位桁側から順に
          無くなってくというものだったと思います。
          プログラミング作法だったと思う。
          フォローありがとうございます.
          おっしゃる通りの内容がプログラミング作法(和訳p.182)に書かれていました.
          同じページにPentiumの不動小数点演算バグについても触れられていますね.
          親コメント
    • by geeekwizzard (30506) on 2006年04月29日 21時50分 (#930814)
      乱数発生器として使えないかな?
      親コメント
    • by Anonymous Coward
      温度を測るための演算のせいで温度が上昇して、正しい温度が測れなさそう。

      温度上昇を小さくするには、ゆっくりと演算すればいいけど、そうすると時間軸の誤差が大きくなる。

      不確定性原理みたいだな。
      共役なふたつの物理量のあいまいさの積は、一定値より小さくなれない、みたいな。

  • 懐かしいPentiumのバグ騒動を思い出してしまいました。

    あの時はIBMがPentium搭載機の販売中止や「計算ミス」の確率を多めに見積もった発表をしたりと大騒ぎになりましたね。
    今回どこか似たような発表をしかけたり・・・しそうにないよな~☆(w

    # PCWAVE 1995年2月号を見ながら回想にふけるID

  • hermitage akihabara "the voices" [gdm.or.jp] より

     「売ったのはだいぶ前の話だな」 (4/28)
     -----某ショップ店員談

    あんな高い物を個人で買った人、いるんですね。さすが秋葉原だ。

    そんな自分もOpteron144(Socket939)持ち。ふつーのCPUとしてしか使っていませんが。
    (一応デフォルト1.8GHzのところOCで2.5GHzほどまで動作確認)
    --
    まぐろたべたい
  • by Anonymous Coward on 2006年04月29日 20時11分 (#930762)
    このOpteronの計算結果を使って学術論文を書いてしまったら、きっと「再現性のない実験結果で論文をでっちあげた」としてウソツキ呼ばわりされてしまうのだろうか。
  • Cool'n Quiet 機能の閾値にミスがあったとかそういうことでしょうか?
typodupeerror

アレゲはアレゲ以上のなにものでもなさげ -- アレゲ研究家

読み込み中...