深度学习的概念现在已经是十分火爆了,这种终极的基于优化和统计的函数拟合技术已经征服了计算机科学大部分领域,以至于所有的人都希望自己从事的领域能和神经网络攀上一些关系。成功的人,叫做“XX领域最早使用XX网络的那一批”,久而久之,成了被瞻仰的理由;班门弄斧,应用失败的人,也可以给自己贴上先烈的标签,在机构或者公司里,用壮阔的经历和动人的眼泪谋得一官半职。
我周围的很多人,已经依靠这件宝贝获得了很多的利益。和他们在一起,听他们谈论起各种调整网络结构的技巧以及“会议见闻”的时候,难免会感受到一些压力。在科研机构里面,多发文章才能证明自己的生存能力,才可能获取更多的资源,才更有底气和面子(不管是对同性还是异性。。。)。默默无闻的人,总是被扫进记忆的垃圾桶——即使最终他们忍受了应得的苦难,发现了另外的宝藏,难免带着一身恶臭,不能见人。
在厦门大学,我选了庄宝煌教授的大学物理课程。庄是一个可以熟练地用本质的数学语言描述物理现象的人,也是一个喜欢在大众面前发表各种奇谈怪论的有趣人物。他可以连续数十个昼夜研究黎曼猜想(也许只是他眼中的黎曼猜想:)),也可以在课堂上解读七绝连环诗并且给全物理系的同事发邮件炫耀自己的成果。不过印象最深的还是他一直告诫我们要“随大流”。
对于科学来说,最重要的一直是可解释性,所有的部分都应该像玻璃一样拥有可以触碰的透明。
最近带了两个来自印度的研究助理,他们需要实现一些有点过时而且复杂的信息检索模型,并在有一些混乱的海量文本数据上测试自己的成果。要完成这样的工作需要耐心,特别是对于两位“深度学习爱好者”来说。 他们很尽职,不过在交谈的时候我时刻可以感受到他们对于应用前沿技术的憧憬。
不想耽误别人的青春,也不想浪费自己的时间。我在最后一周做出了一些改变,在可以接受的重要部分使用了一些让他们兴奋的东西。于是他们很开心地在第二天表示已经完成所有部分,在跑数据了。。。。(如果早点发现的话我会让老板扣光他们的工资!!!:))
其实信息检索模型在应用神经网络面对的最大问题是维度爆炸和语义拟合,所以我们都不知道能走多远。。。