DtransuはプログラマーさんがあっさりOpenMPを実装してくれたので、かなり助かっています。
コードを確認して「こんなに簡潔にできるんだ」と感心しました。コロンブスの卵と言いますか、餅は餅屋と言いますか、自分ではできないですね。
プロファイリングと簡単なアルゴリズムの追加で、精度を保ったまま、輸送計算は2コアで1.8倍、6コアで3倍のスピードになりました。さすがプロですね。尊敬します。
今はオリジナルコードのミス修正を反映し終えたところです。実施中の計算が一段落つけば、すぐに検証しましょう。
プロファイリングと簡単なアルゴリズムの追加で、精度を保ったまま、輸送計算は2コアで1.8倍、6コアで3倍のスピードになりました。さすがプロですね。尊敬します。
今はオリジナルコードのミス修正を反映し終えたところです。実施中の計算が一段落つけば、すぐに検証しましょう。
GPGPUは並列化が終わったのだから簡単でしょと思いきや、そうではないようです。苦労されています。私の知識はまだまだです。
ところで、最近気づいたのですが、Core i7-980Xを4GHzまでO.C.し、6コア使って並列計算すると1~2日で落ちることがあります。1コア×6ケースでも同じですね。ただ、5コアであれば4日くらいで完走します。O.C.しなければ12スレッドフルで使っても14日くらいで完走します。
やはり常用といっても、時間的な限界があるんでしょうね。
0 件のコメント:
コメントを投稿