Re:C++の場合の参考です。 (#1242774) | Haskellで速いwcを書いてみよう(10)

「Haskellで速いwcを書いてみよう(10)」記事へのコメント

記事ページを表示すべてのコメント取得

検索6コメント Log In/Create an Account

元データって (スコア:1)

by gm300 (14617)

どこにあります？興味あるな。
これ [freebsd.org]と大体同じ？
普通のgnu wc って結構遅いと思います。どこが悪いのかあまりわかりませんでしたが。
C++で書くときに、私が気にするのは、どうやって一文字ずつ判断をやめるか。せっかくの32/64bitマシンなんで8bit単位じゃなくて64bitで調べたい。64bitで調べることができれば単純に見て、8bitの8倍速。さらに32bitか64bitの１ワードから1バイトを切り出す余分なコードが不要に。
で、G++/glibc の strcmp, memchr を使うと画期的に早くなります。

ああ、harshellの人には関係ないですね。
- Re:元データって (スコア:1)
  
  by kr (10950)
  
  はい、元データはそれ [freebsd.org]と大体同じです。たぶんwcの実行速度の傾向に大きな違いが出ることはないでしょう。
  # よく考えたら、手元の/usr/share/doc/en/books/handbook/book.txtって、
  # マシンに最初にFreeBSDをインストールした時の古いファイルのままupgradeされてません。
  # 改めて中見たら、FreeBSD 5.4-RELEASEがどうとかとか書いてある。(古っ)
  後で気付いたんですが、テストデータは青空文庫とか Project Gutenberg [gutenberg.org]辺りから持ってくれば良かったかもしれません。
  ところで、今回C++版・C版として使ったのはtanakh氏 [hatena.ne.jp]の「ふらふらと何にも考えないで書いたコード」「適当に書いたコー
  - C++の場合の参考です。 (スコア:1)
    
    by gm300 (14617)
    
    strcmp 等は本当にチューンされています。始めは自作でいいじゃんと思っていましたが、とても全部のアセンブラ命令を知っていないと真似できないレベルで手が入っています。
    SIMD の前に重要なのは、文字列の評価回数ですね。それもlisp的な評価じゃなくて、生のbyte stream イメージで。
    
    wc みたいな単純なプログラムの場合、最速 1char/cycleで評価したいじゃないですか。cpu clock が 1GHz なら 1Gchar/sec.
    ところが、diskはそんなに早くないし、disk から cpu で生に見えるまでに何回もコピーされてくる。でよくわかならいので、オイラは100Mchar/secを目標においています。それ
    - Re:C++の場合の参考です。 (スコア:0)
      
      by Anonymous Coward
      
      ispace()相当の事を、テーブル引きや巨大switch文にすると速くなりそうですね。
      
      # ２バイト毎に見てくのは可能なのかなぁ？
      - Re:C++の場合の参考です。 (スコア:1)
        
        by gm300 (14617) on 2007年10月31日 23時40分 (#1242774) ホームページ日記
        
        テーブル化は難しいです。コード書くのは簡単だけど、テーブルが大きすぎると、キャッシュに入りきらない。小さく切り詰めると、切り詰めるための、オーバーヘッドがでる。
        
        2バイトで見るには、たとえば、short *dst, *src ; for( ; *pnt & 0x00ff != 0 && *pnt & 0xff00 != 0 ; *pnt++=*buf++) ; みたいにするんでしょうね。あるいは、*src & *src >>8みたいに圧縮するか。アラインしていないデータとか境界部分の処理がめんどうです。
        ずっと昔のcomputer today という雑誌にその手の連載がありました。
        
        シェア
        
        親コメント
        
        Re:C++の場合の参考です。 (スコア:0)
        
        by Anonymous Coward
        
        キャッシュは…１バイトずつ見る場合ならともかく、２バイトずつ見る場合を１次キャッシュに全部納めるのは難しそうですね(Athlon 64なら収まるかな？)。
        
        # 投稿大のもーた御大のアレ？＞Computer Todayの連載

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

Haskellで速いwcを書いてみよう(10) More ログイン

「Haskellで速いwcを書いてみよう(10)」記事へのコメント

元データって (スコア:1)

Re:元データって (スコア:1)

C++の場合の参考です。 (スコア:1)

Re:C++の場合の参考です。 (スコア:0)

Re:C++の場合の参考です。 (スコア:1)

Re:C++の場合の参考です。 (スコア:0)

スラド