Math, theory and observation.
只要我想,我可以试着用形而上学重写一遍信息检索的基础:从黑格尔和费尔巴哈的著作里面搜刮几个词语,把容易理解的概念和演算法则说成是“理性精神”,把那些我看不懂的东西推说是“客观精神”,模型和算法就叫做“精神运动”;再花上钱或者人情,找个“AI自媒体”的公众号放上一篇像模像样的通告,取上诸如《XX点赞,大佬力挺,最新超越blahblah!》的标题,一样把麻瓜耍得团团转(所以我从未订阅这些公众号,作为一个平凡人,希望每天早上一睁眼就吃点好的,而不是面对那么多莫名其妙的“疾风”。如果按照新闻从业人员的职业规范,这些家伙没有一个能够上岗)。
然而自我陶醉的理论最终要接受现实的考验,在这之间架设名为评估的桥梁。科学是求错不犯错而不是求对,否则就容易陷入重言式的陷阱。我见过几篇研究“可解释性”的文章,粗略扫描我就知道他们可能进入了一个无法自拔的循环:在自己设计的体系里面不管怎么说怎么测试最终都是自己的结论对。就好比如果对 SDM 穷举参数值进行优化,它必然胜过 LM——单从数学的形式上说后者是前者退化的情况。这样的比较是毫无意义的,而要验证它们对于现实不同的观察和理解,再反推出结论。顺带一说,有一家国内公司之前招聘过专门研究“可解释性”的研究员,一开始我很赞赏该公司领导的眼界和魄力,但转念一想我就担心起担任这个职位的人,因为“解释性”是真正苍白的深渊。除了少数几个得到验证的东西以外,大部分的模型都是不知正误的,又如何在此基础上“解释”呢。Yann Lecun 最近在 Twitter 上评论 “PULSE 风波”说,用白人的数据集训练出来的模型当然结果输出是白人,用黑人的数据集训练出来的模型当然结果输出是黑人。这是很实在的话,但会让人怀疑这些理论到底是“智能”还是别的东西。
最近有一位老师在推广自己在几何方面的成果,讲解比较深奥的数学知识,顺便提到一些和“深度学习”可能的联系。他老人家传授的数学正确而且精彩,晚辈瞎掰的一些东西可能也要学习借用类似的步骤自圆其说,但每个学科都有自己的见解,否则这个世界只需要数学这一种科学了。有些文章的标题,自己迫不及待地加上了不少激进的词汇,结果还是老样子。这让我想起武侠电视剧的主角在荒郊野岭捡到一本“武林秘籍”之后对着空气瞎比划几下盯着自己的爪子得意傻笑的场景。从这方面思考,解释不仅是解释,否则某个“正确的解释”只会产生一样的结果,某种意义上说等于没有解释。所以求的不是解释,而是理解上的前进或不同。
(所以我从未订阅这些公众号,作为一个平凡人,希望每天早上一睁眼就吃点好的,而不是面对那么多莫名其妙的“疾风”。如果按照新闻从业人员的职业规范,这些家伙没有一个能够上岗)。
说得好!