2010年9月13日月曜日

Dtransuの並列化!

コンパイラーの最新版がきたので、とりあえず、ビルド!
今組んでいる23万点モデルの初期定常で計算時間をチェックしてみました。

まず、/O2を/O3で試しましたが、速度が上がらず。次にSSE4.2を入れると微妙に早くなりますが、殆ど変化しない状況でした。これには期待していたので残念です。自動並列化に関しては逆に速度が落ちてしまいました。結局、これらの設定を変えただけでは速度の上昇が認められませんでした。

繰り返し計算では、収束したら次のステップへという設計のため、loopの回数が決まっていないことも並列化しづらい点であるように思われます。最終はOpenMPですが、ここまでくると時間が掛かるため、ソフト屋さんにお金を払ってでもやってもらいたいですね。明日以降も、色々触ってみようと思います。

0 件のコメント:

コメントを投稿