2020年4月29日水曜日

CatBoost Encoder

CatBoost
https://papers.nips.cc/paper/7898-catboost-unbiased-boosting-with-categorical-features.pdf

最初は何を言っているのかわかりませんでした。勘違いしていたのですが、これ、GBDT の一つなのですね。知りませんでした。
https://catboost.ai/docs/concepts/algorithm-main-stages_cat-to-numberic.html

でも、Encoder として見ると単純。文献やサイトの数式は難しそうに見えますが、少量ならEXCELでも再現できるレベルです。


Category Encoders では、Pが平均値として実装されています。オリジナルとは若干異なっています。

リークへの配慮が良く分かる実装です。


0 件のコメント:

コメントを投稿