Re:ビット長 (#1511998) | 確率的コンピューティングでパフォーマンスをブースト

「確率的コンピューティングでパフォーマンスをブースト」記事へのコメント

記事ページを表示すべてのコメント取得

検索86コメント Log In/Create an Account

ビット長 (スコア:0)

by Anonymous Coward

現状、精度は低くていいが大量に計算したいときはSSE等、ビット数が少ないものを集めて一回で計算するような
仕組みがあるようですがそれより有望なんですかね？
素人考えだと誤差有り倍精度を2倍周波数で演算するよりは誤差無し単精度を通常クロック(但し1クロックに2個計算できる)で計算した方が計算結果に安心感があるのですが詳しい人解説お願いします。
MPEG２あたりのまでの動画形式だと丸め誤差の積み重ねで画がおかしくなることがあったっけ。
- Re: (スコア:2)
  
  by L.Entis (21733)
  
  SSEでは単精度演算だけでなく、有効桁数が単精度の半分の逆数、平方逆数の近似計算を行う命令がありますね。
  実際、演算精度がそれほど必要でないシーンでは重宝します。
  
  が、プログラミングする側が演算精度に神経を尖らせる必要があります。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    今は平方根や逆数が高速になったので不要になりましたが、
    もともとはパイプラインを有効に使うためのものでした。
    
    AltiVecのように本当にビット数が半分(12ビット)だったら良かったのですが、
    実際は11ビットなので、近似値から精度を上げていくような
    精度はそのままでパイプラインを有効活用するという高速化手法には役に立たない代物。
    設計者は頭悪すぎると言わざるを得ません。
    
    2の冪乗の値の逆数で余計なビットが立たないことを仮定したり、
    端数がないことを仮定して式に組み込み、最後にfloor取ったりすると悲惨な結果に。
    - Re:ビット長 (スコア:1)
      
      by L.Entis (21733) on 2009年02月12日 15時03分 (#1511998) ホームページ日記
      
      > 今は平方根や逆数が高速になったので不要になりましたが、
      > もともとはパイプラインを有効に使うためのものでした。
      
      一応、SSE でもそう言う思想の命令だったかとは思いますが、rcpps（半分精度の逆数）を使って近似計算を行うステップの合計クロックがdivps（除算）と同じになる（上に当然精度も劣る）ので、私は（私も？）基本的にはdivpsを出来るだけ効率よく使う（データを4つ詰め込んで使う）方向で最適化することにしています。
      なので rcpps は高速な逆数命令として使う以外は、divps ほどは精度は要求しないけれど rcpps 単体よりは欲しい、そして実行リソースが余っている、と言うような激レアケースでのみ rcpps で近似の精度を上げる計算を行っています（＾＾；
      
      シェア
      
      親コメント

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

確率的コンピューティングでパフォーマンスをブースト More ログイン

「確率的コンピューティングでパフォーマンスをブースト」記事へのコメント

ビット長 (スコア:0)

Re: (スコア:2)

Re: (スコア:0)

Re:ビット長 (スコア:1)

スラド