tamanegiの日記: cudaメモ
日記 by
tamanegi
同一 warp 内のスレッドは __syncthreads で同期する必要はないけど、同一 warp 内での shared や global メモリへの書き込みを __threadfence(_block) とかで同期する必要がある場合は存在する。自分で書いたものは良いみたいなんだけど、他人が書いたものはそういうわけにはいかないらしい。たとえ同じ warp 内であっても。
# これになかなか気づけなくて今日は半日無駄にしたorz
# そしてやっと動いたコードのパフォーマンスがイマイチであることも発覚した
# かなしい…
cudaメモ More ログイン