CatBoost
https://papers.nips.cc/paper/7898-catboost-unbiased-boosting-with-categorical-features.pdf
最初は何を言っているのかわかりませんでした。勘違いしていたのですが、これ、GBDT の一つなのですね。知りませんでした。
https://catboost.ai/docs/concepts/algorithm-main-stages_cat-to-numberic.html
でも、Encoder として見ると単純。文献やサイトの数式は難しそうに見えますが、少量ならEXCELでも再現できるレベルです。
Category Encoders では、Pが平均値として実装されています。オリジナルとは若干異なっています。
リークへの配慮が良く分かる実装です。
0 件のコメント:
コメントを投稿