2019年2月6日水曜日

TensorFlow + Docker

TensorFlow をDocker で動かそうとして、はまりました。

公式のイメージを使っているにも関わらず、ライブラリのインポートでエラーが出ます。
Dockerfile をビルドすれば大丈夫か?と試すも、ビルド途中でエラー。使えません。

時間をかけて触ってみましたが修正できず。
最終的にはRAPIDS のイメージをベースに、tensorflow-gpu と keras 、その他必要なライブラリを全て conda で入れて、ライブラリ間の依存関係を解決。tensorflow は 1.9、CUDA は 9.0 まで落ちました。が、tensorflow を import できました。
ただ、RAPIDS の必要条件(9.2)を満足していません。CUDA 10 でのビルドもエラーですので、現段階では共存をあきらめざるを得ません。本当に面倒。

このコンテナから、新たなイメージを作成し終了。再現はできるようになりましたが、きちんと働いてくれるのでしょうか?

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
20190209追記
$ conda update --all をかけなければ、tf1.12、CUDA9.2 を維持できました。どこかで引っ掛かるまでは、このイメージで動かしましょう。

0 件のコメント:

コメントを投稿