作者:王茂霖,华中科技大学,Datawhale成员

内容概括

1.经典特征工程构造

2.特征工程案例实践


PPT完整下载:后台回复“210501”可获取

视频地址:https://www.bilibili.com/video/BV1sf4y1s7Fw


特征工程构造

王茂霖:特征工程方法总结!_特征选择


特征工程是数据科学最有创造力的部分


王茂霖:特征工程方法总结!_特征工程_02


一、特征的类型汇总

王茂霖:特征工程方法总结!_特征工程_03


二、特征工程方法总

王茂霖:特征工程方法总结!_特征工程_04


三、类别特征的常用编码方法

王茂霖:特征工程方法总结!_编码方法_05

1.Label Encoder

王茂霖:特征工程方法总结!_特征工程_06

2.One-Hot Encoder

王茂霖:特征工程方法总结!_编码方法_07

3.Frequency 编码

王茂霖:特征工程方法总结!_特征选择_08

4.Target 编码

王茂霖:特征工程方法总结!_特征工程_09

5.其他编码

王茂霖:特征工程方法总结!_编码方法_10


四、数值特征的常用编码方法

王茂霖:特征工程方法总结!_特征工程_11


五、时间特征的常用编码方法

王茂霖:特征工程方法总结!_编码方法_12

特征工程实践

王茂霖:特征工程方法总结!_编码方法_13

王茂霖:特征工程方法总结!_特征工程_14

1.特征构造

特征工程构建大概可以从三个方面入手:领域特征,交叉特征和多项式特征。


王茂霖:特征工程方法总结!_编码方法_15

2.特征选择

特征选择可能会降低模型的预测能力。因为被剔除的特征中可能包含了有效的信息,抛弃了这部分信息会一定程度上降低预测准确率。

王茂霖:特征工程方法总结!_特征选择_16

本文作者

王茂霖,Datawhale重要贡献成员,Datawhale&天池数据挖掘学习赛开源内容发起人,全网阅读超10w。


参赛30余次,获得DCIC-数字中国创新创业大赛亚军,全球城市计算AI挑战赛,Alibaba Cloud German AI Challenge等多项Top10。

分享地址

王茂霖:特征工程方法总结!_特征工程_17