本博文引自王树森老师推荐系统。
视频地址:排序03:预估分数融合_哔哩哔哩_bilibili
课件地址: https://github.com/wangshusen/RecommenderSystem

前几节课讲了多目标排序模型。多目标模型输出对点击率点赞率等指标的预估。这节课讲怎么融合多个预估分数。

最简单的分数融合方法就是求各种预估值的加权和
这一项$p_{click}$意思是模型预估的点击率,它的权重是一;这一项$p_{like}$是模型预估的点赞率,它的权重是$w_1$;后面还有很多项,包括预估的收藏率、转发率、评论率等等。
17_融合预估分数_1

这是另一种简单的融分公式。括号外面是点击率的预估,括号里面是很多项的加权和,这个公式有实际意义。
17_融合预估分数_2
$p_{click} · 1$就是预估的点击率,$p_{click} · p_{like}$意思是曝光之后用户点赞的概率,为什么呢?$p_{click}$是曝光之后用户点击的概率,$p_{like}$是点击进去之后用户再点赞的概率。

两者相乘就是曝光之后用户点赞的概率。
这里讲的两种公式都很简单,在工业界都挺常用。

示例1

海外某短视频app用这样的融分公式,跟前面讲的加权和有些区别。$p_{time}$的意思是预估短视频的观看时长,比如预估用户会观看十秒。整个这一项是${(1+w_1·p_{time})^{\alpha_1}}$,这里的$w_1$和$\alpha_1$都是超参数,需要手动调,线上做AB测试选出合适的超参数。这一项类似,是对点赞率的变换,用了不同的超参数。有很多个预估指标,做函数变换得到很多项,对他们取连乘得到最后的预估分数。
17_融合预估分数_3

示例2

国内某个老铁短视频app的融分公式很有意思,跟前面介绍的方法完全不一样。多目标排序模型给$n$个候选视频打分,得到预估的播放时长、点击率、点赞率、转发率等指标。
以预估时长$p_{time}$为例,暂且只用$p_{time}$这一个分数,对n个候选视频做排序。如果某个视频的排名是$r_{time}$,则它的分数为
公式里的$\alpha$和$\beta$都是需要调的超参数。很显然预估的播放时长越长,排名就越靠前,$r_{time}$就越小,最终得分就越高。
上面按照预估的播放时长做排序得到一个分数,如果按照预估的点击率做排序会得到另一个分数。有点击、点赞、转发等很多个指标,那每一个视频会有很多排名,每一个排名变成一个分数,对所有这些分数求加权和,就是最终的融合分数。这个融分公式和前几种都不太一样,这里不是直接用预估的分数,而是用每个分数的排名。公式中的$r_{time}$、$r_{click}$、$r_{like}$是某个视频的三个排名,分别是按照预估时长,预估点击率和预估点赞率做排序得到的分数。
17_融合预估分数_4

示例3

最后介绍国内某电商的融分公式,电商的转化流程是这样的:曝光,点击,加购物车,最后是付款。
模型要预估中间每一步的转化率,包括从曝光到点击;从点击到加购物车;从加购物车到付款。
这是最终的融分公式:把预估的点击率,加购物车率,付款率和物品价格都乘起来。指数$\alpha_1$到$\alpha_4$是超参数,需要调。假如$\alpha_1$到$\alpha_4$都等于1,那这个公式就是电商的营收,有很明确的物理意义。

这节课简要介绍了工业界排序的几种融分公式,这节课就讲到这里,感谢大家观看。