2019年5月3日金曜日

BalancedBatchGenerator

Keras を使ったモデルで、交差検証時にデータのバランスを調整したいと考えました。

プロがよく使われてましたので、良い結果が出るのだろうと。
前から使いたいと思っていましたが、実力と時間がなく、今に至りました(アンサンブルはマダマダ先)。

imbalanced-learn の BalancedBatchGenerator を使おうとしたのですが、ハマりました。サンプラーを指定すると、エラーが出ます。なぜエラーが出るのかよくわかりません。
数時間試してみたところ、どうも SMOTE 系がダメなようです(ほかに設定が必要なのでしょうか?)。私の環境では、以下の通り。

OK:ADASYN, RandomOverSampler, SVMSMOTE
NG:SMOTE, SMOTENC, BorderlineSMOTE

RandomOverSampler は軽い。でも、過学習が怖い。
以前、SMOTEでうまくいってたのでコチラを使いたかったのですが。
Ver.UPを待ちましょう。

0 件のコメント:

コメントを投稿