深度学习CTR模型要解决的几个关键问题
- CTR任务特点:大量离散特征的表示问题
- CTR任务特点:如何快速处理大量高维度稀疏特征?(OneHot 2 Dense)
- 特征工程:如何从手工到自动?(深度学习的优势)
- 特征工程:如何捕获和表达两两组合特征?(FM机制神经网络化)
- 特征工程:如何捕获和表达多组组合特征?(利用Deep网络)
CTR任务中的他特征类型有连续特征和离散特征,连续特征适合DNN处理,离散特性你不适合特征处理。那么如何使得离散的特征适合DNN处理呢?直观的感觉,是one-hot化。
但是one-hot化后,参数过多,不适合CTR预估。
解决思路:从one-hot到dense vector转化
所以,形成的DNN结构如下:
再加入连续特征:
这就是FNN模型:Factorisation-Machine Supported Neural Networks
DNN输入问题解决了,但是低阶和高阶的特征组合隐含地体现在隐层,我们对低阶特征单独建模。定义一个神经网络版的低阶模型。
把低阶特征组合模型插入网络结构中
互联网公司CTR案例
Goole YouTube推荐系统
阿里巴巴 Deep Interest Network
京东 TelePath