所谓“策略随机检索” (Strategic Random Retrieval)
read more...
本来,在这个系列的最后,我准备放上几个 runs,进行期待已久的“清算”。可是有个小朋友给我分享了自己好友在父母长达十余年外遇、家暴的历史下艰难生活的故事,告诉我要“be kind to others”。所以那种“灭门”的事情以后再说。现在想写关于 diversity 的故事。
这个世界充满了优胜劣汰,所有设计模型的人都想着如何 do the best estimation given observations. 供给信息的人则想着如何 maximize the importance of their features. 所以系统忙着 learning to rank,供给者忙着做 SEO,而用户则忙着辨认真切的结果和“充值”的结果。这个三方系统的内部成本在这样的内耗中不断增加。正确性和相关性、以及任何试图学习这两者的性质,最后都失去意义。
一种没有排序的检索从随机返回任何结果中产生。为了满足愉悦和可靠的目标,在最开始它可以从向传统的检索施加有策略的扰动开始。这种扰动可以是一种约束,也可以是一种行为。
**(当然我说的不是“转化率”。敢把转化率当成吹嘘的资本写进每次署名七八个作者的的学术论文里面也就只有国内几个胆子大的公司才能成就如此伟业。)