いろいろビルドの設定を変えて計算してみましたが、結局は標準設定(/O2のみ)が一番早いようです。直接、OpenMPを噛ましていくしかないようですね。これは手間がかかりそうなので、ひとまず置いときましょう。
ただ、ハードを変えた影響は劇的に現れました。WSまで用意しなくても、早い単コア、メモリで複数ケース計算させるといった発想が良いのかもしれません。Core i7-980Xで5万2千点の移流分散計算が38分で終わってしまいました。今まではXeon5000番台で1時間かかっていたのです。これは期待以上でした。しかも、6コア12スレッドありますので、平衡して複数のケースの計算も可能です。今日は5ケース平衡して計算させて見ましたが、まだまだ余裕がありそうです。すばらしい、Core i7-980X。
明日からはメモリとCPUのオーバークロックでどの程度詰められるかを見て行きたいと思います。
0 件のコメント:
コメントを投稿