关于相关性之结构(v):形式信息需求
read more...
一个人在搜索框写下一串文字,不意味着已经想好自己需要什么样的内容。生理的欲望驱使他想要寻找,表达能力约束他查找的范围,查找到的结果强化他的认知的狭隘,使得他确信找到的就是想要的,其实他自己一开始不知道能够得到什么样的结果。一个模型由社会语言书写,假定输入必有去处,简单的是一个列表,复杂的是一个体系(taxonomy,比如 a taxonomy of web queries),“没有去处”也是一个假设的结果。所以说它们是一个和数值对应的索引,一个分类问题。几个模型的结果加权平均,也属于某种分类,因为权重就是用数值表达的选择(这是说模型表达结果的能力也是有限的,尽管通常用浮点数进行计算,但浮点数不是实数,如果以后出现能够做指数级运算的机器,这种表达能力的问题可能就会显现出来)。因为双方各自具有的局限性,一次检索的过程其实也是模型设计者对使用者“施暴”的过程。就好像你走进一家商店,想要买一件东西,售货员告诉你“这里没有这件东西,但我们有另外一件东西似乎很符合你的要求”。现在的问题是,使用一种方式为每件事物表达它们固有的欲望,而不是分辨它们自己到底是什么。