2010年12月2日木曜日

Dtransuの高速化

Dtransuの並列化は置いておき、とりあえずソース内の連立方程式の収束許容値を甘く設定し、コンパイルしてみました。
PCGエラーが1.5×10^-4程度だったので、その3倍を設定し、定常チェック。その後、非定常を計算してみたところ、10^-9の場合の結果とほとんど差が出ませんでした。最小メッシュ1mで、最大2cmの差です。しかも、局所的。

驚いたのは、22万節点で17年×6ケースの計算時間が28時間強。以前は4日かかっていましたので、恐るべき高速化です。今まで、モデルに対し厳しすぎる精度を求めていたんですね。なお。CPUはCore i7-980Xを4GHzまでO.C.して計算しました。

その後、並行計算を9ケース+他の負荷作業1種に増やしてみたところ、残念なことに計算が2日以上かかってしまいました。12スレッドあるとはいえ、コア数以上の働きをさせると、遅くなるようです。

0 件のコメント:

コメントを投稿