Keras を使ったモデルで、交差検証時にデータのバランスを調整したいと考えました。
プロがよく使われてましたので、良い結果が出るのだろうと。
前から使いたいと思っていましたが、実力と時間がなく、今に至りました(アンサンブルはマダマダ先)。
imbalanced-learn の BalancedBatchGenerator を使おうとしたのですが、ハマりました。サンプラーを指定すると、エラーが出ます。なぜエラーが出るのかよくわかりません。
数時間試してみたところ、どうも SMOTE 系がダメなようです(ほかに設定が必要なのでしょうか?)。私の環境では、以下の通り。
OK:ADASYN, RandomOverSampler, SVMSMOTE
NG:SMOTE, SMOTENC, BorderlineSMOTE
RandomOverSampler は軽い。でも、過学習が怖い。
以前、SMOTEでうまくいってたのでコチラを使いたかったのですが。
Ver.UPを待ちましょう。
0 件のコメント:
コメントを投稿