作業をお願いしていたプロより連絡がありました。
C++にまで移植していただいたのですが、結果は精度面でOUT。
惜しいことに、デバイスエミュレーションで動かすと正しい値が出るようですが、実際にGPUに載せると正しい値が出ないとのこと。プログラミング自体は問題ないのでしょうね。TESLAで駄目なようですから、プロが仰るようにコンパイラかライブラリ側に問題があるのでしょう。素人でも分かりやすい説明でした。
ここまでしていただいて、本当に感謝です。
今回は残念でしたが、CUDAやコンパイラのVer.UPで解決できそうですね。気長に待ちましょう。
0 件のコメント:
コメントを投稿