我比较欣赏的NLP/IR学者

这里列举的都是已经功成名就或者有一定声望的学者

林钦佑 (Chin-yew Lin):我一直以为微软的“小冰”算数学题的功能是用了很复杂的自然语言理解技术,看了论文以后才明白,他叫了几个RA收集网上解题网站的数据,然后用统计学习的办法提取解答过程的文本特征,生成一些特定的解答模板(未知数和方程)。遇到新的查询的时候,先查找最相似的解答模板,然后把数值填进去,最后解方程得到答案。 这种巧妙避开难点曲线救国的壮举如同欧拉应用韦达定理到无穷级数方程得到巴塞尔问题的解

吕正东:比较喜欢他在利用神经网络处理NLP和IR问题时候采用的符号主义思想。国内很多的研究人员满脑子都是向量表示+神经网络,然后把解决问题的方法论归结到调整神经网络中各种奇怪的激活函数和网络结构。

W. Bruce Croft:有很多基础性的工作。很多人对他的印象停留在十年多前向量空间模型大行其道的时候,其实他们组也探索了不少利用新的表示法的检索模型(比如  paragraph2vector 和 PRMS),虽然结果都不是很理想

Krisztian Balog:巴主席把正常人能想到的 entity retrieval model 都做了一遍。。。。每次我想到一个新的想法要实现的时候,我都很兴奋。几个月之后,当我得到一些结果的时候,发现他和他的马仔已经把论文拿去某个会议投稿了。。。。大大提升了我延期毕业的风险

狠话集

  1. 我过得很低调很朴素,但不代表我很穷。有些话不想说得过于直白,自重。
  2. 早生十年或者晚生十年,我都功成名就。偏偏生在这承上启下的时代,干着扛旗的活。
  3. 有的人读了乔治奥威尔之后,一辈子都出不去,活在恐惧里。

对最近中国大陆房价上涨迅猛现象的思考

那些想用房产税来抑制房价的人要明白,就是收100%的税也不会改变效用序数,这个道理太简单。现在这情况明显就是各生产要素的边际利润严重不均。 原因的话我觉得主要是政府失灵,市场失灵是副产品。 不破不立,有些稳定不稳定的东西考虑太多了就永远放不开手脚,去年证监会推出的熔断机制很明显就是这个思维指导下的产物。

过敏性鼻炎(鼻敏感)病因探索与保养经验

声明:本文仅供参考,本人非持牌医师,不提供任何治疗意见。请遵医嘱进行治疗。因为阅读本文进行尝试而导致的任何人身伤害,本人不负任何责任

博主曾经长时间受敏性鼻炎困扰。 现在分享自己对发作原因的探索(以下每个原因我都用简单的控制变量法尝试过)

  1. 花粉、空气中的粉尘和空气质量: 这三个都是常见的病因,要判断是否由这些原因引起很简单,只要买一至两个空气净化器放在卧室里 24 小时不停工作,然后看看自己的症状是否减轻。记得要连续试验一到两周,因为开始时可能会有心理暗示导致一些激素分泌方面的异常从而减缓症状。(其实有不少减轻流鼻涕症状的药物的主要成分是激素)
  2. 晚睡,熬夜:根据我个人的经验,如果每天在凌晨两点之后入睡,早上起床后鼻炎会发作得比较厉害,不停流鼻涕。这其中的原因可能是人体夜间有几个排毒期,如果晚睡会导致免疫系统发生一些变化,从而作出反应。
  3.  天气变化:比如突然转冷或转热,以及空气湿度突然的变化。
  4.  霉菌:这是一个非常隐蔽的发作原因,相当多的鼻炎患者没有注意过这一点。  霉菌产生的孢子弥漫在空气中,会对鼻炎患者造成很大的伤害。因此如果患有鼻炎,应该检查一下所居住的环境是否出现书籍、墙壁、木制品等物件发霉的现象,一旦确认应该立刻使用专业的除霉剂( 推荐德国的 “伯瑞宝 Poliboy 除霉剂” 这类基于酶催化剂的除霉剂。 用双氧水或者 84 消毒液之类含次氯酸、过氧化氢的清洁液只能去除表面的菌斑不能破坏菌体。) 另外特别要注意的是,如果房间有基于滤网的空气净化器,在除霉后应该立即更换滤网并且消毒机器,不然孢子会附着在滤网上。最简单的实验就是把鼻子凑在空气净化器的出风口,检查自己是否咳嗽不停以及流鼻涕。 基于静电吸附的空气净化器(比如 Lightair) 不会受到影响
  5.  幽门螺旋杆菌:需要说明的是,幽门螺旋杆菌和鼻炎的关系在临床上有待证实,并且学术界出现过一些结论相反的报告。
  6.  螨虫

总的来说,我认为过敏性鼻炎是免疫系统对自身异常,或对异常环境的正常反应。患者应该从免疫这方面去查找病因

一些保养经验:

1、 不要着凉

2、使用盐水洗鼻(非常有效,在未查明真实原因之前,每日早晚洗鼻可以大大缓解症状。 可以使用专用的洗鼻盐,或者选用不含碘的食盐。盐的选择可以参考这篇文章:https://lxsay.com/archives/462

3、 服用药物(建议只在发作剧烈的时候服用,平时通过洗鼻改善状态。药吃多了可能会头晕)

4、去医院做过敏原筛查

5、去医院做幽门螺旋杆菌筛查(医生一般认为幽门螺旋杆菌可治可不治,但我建议如果你深受鼻炎困扰,还是试一下吧)。这种方式起效的原因可能是幽门螺旋杆菌患者一般接受“三联”或者“四联”疗法,需要服用阿莫西林之类的消炎药。消炎药有时可以部分缓解鼻敏感的症状。

6、使用空气净化器(但要勤换滤网)

7、 保持居住环境整洁和干燥,定期检查墙面、床面等是否发霉,若有应除霉和除螨虫。并定期消毒床单、枕头等等,洗衣机如果太脏也可能会引起这类问题

8、(update) 如果居住的房间放有很多书籍或者工具,应该用烘干机先烘干一个小时,擦去表面的尘土和霉斑(如果有),并用保鲜膜或者塑料袋包起来,否则可能会霉菌大爆发。。。。

9、(update) 可以去医院做一个肺部的CT扫描,如果发现部分有一些疑似小结节的组织,建议遵循医生建议,比如吃拜复乐(莫西沙星)、手术切掉,或者继续观察,这也应和了第 5 点观察。

最无聊的几种发烧友

  1.  音响发烧友:用电饭煲的电源线接耳放可以听到米饭的香味,病得不轻
  2.  摄影器材发烧友:没学过工程光学、物理光学和几何光学的文盲聚在一起对着几张照片和几个数据瞎讨论,浪费时间
  3.  各种信用卡机票酒店类发烧友:浅尝无妨且有益,但浸淫太久就是有病。靠本事挣钱,有多少实力就享受多少的服务,整天净寻思着钻空子,徒劳。
  4.  手机等数码产品发烧友:装逼犯里的战斗机,不会造还偏要恶言恶语,“评测”是这个世界上最无聊的东西之一。

NASDAQ:AMD 中国市场基本面简略分析 2016

声明:本文内容仅供参考。因消息来源有限,可能存在错误。因为阅读本文后进行相关投资引起的损益,本人不负任何责任。

AMD (Advanced Micro Devices) 就是超微半导体,俗称“农企”、“按摩店”

概况: 前两年资金短缺,卖大楼换资金。 产品线全面落后于竞争对手Intel和NVIDIA,人心惶惶。

近来Lisa Su上任后动作频频,Polaris 10/11 系列显卡的发布可视为转折点,目前情况略有好转

9月份机构估价每股8~9美元左右,目前价位10~10.6美元

(update 2017.1.10  现在的价位是10.5~12美元)

 

分析:

利:  1. RX480/470/460系列显卡发布,市场反响不俗。与竞争对手NVIDIA的GTX 1080/1070/1060/1050相比有一定性价比优势。

2. AMD积极赞助中国国内的电子竞技比赛,收获好评与市场认知度,为打开游戏市场奠定良好基础。目前中国国内电子竞技事业发展态势较为平稳,与10年前相比发展环境大有改善。预计在直播平台等自媒体推动下未来5年内仍有较大增长。

3. AMD发布GPU加速器Radeon Instinct与Rocm 工具包。开始关注学术市场。目前已有基于OpenCL的开源深度学习框架(如clTorch)出现

4. 中文舆论支持。 由于之前的劣势以及竞争对手的高价策略,目前舆论对AMD持同情态度,期待农企能推出性价比高的产品。 百度部分贴吧(显卡吧、图拉丁吧)开始大量出现使用RX480/470显卡装机的讨论内容。

5. 根据本人收集到的知乎上部分amd上海研发部员工的言论,目前产品开发有条不紊且有有效的进展。

6. 主打中低端市场的RX470D/460被发现存在“开核升级”的可能,可能会引发购买的潮流。

7. 即将上市的Zen系列CPU据传性能可与Intel i7系列抗衡

8. 由于广电总局对网络电视机顶盒的管制导致对HTPC的需求悄然上升,AMD fusion平台可能会收到潜在的红利

 

弊: 1. 资金可能仍不充裕

2. 对基于OpenCL的深度学习框架重视程度不够,无法吸引大量有稳健需求的人士,相关开源项目较少且稳定性无保证、无法跟上最新研究产生的计算需求。NVIDIA目前已赞助(收买)若干重量级框架为N卡背书

3. PC市场疲软

4. Fusion平台战略的效果仍不明显

个人估价: 一年后维持在每股15美元左右,  最高可至20美元。

历史虚无主义举例与动机分析

  1.  “我觉得其实1949年前国民党也没做错什么啊,我们只是被胜利者洗脑了而已”
  2. “为什么他们(指香港民众)为什么不能做出选择!?(指“自决”)”——一位读了一年msc的传媒爱好者这样问道

在中国,“历史虚无主义”其实是个政治术语,我对以上内容反映的价值观不感兴趣,但对说话的动机却非常好奇。据个人观察,部分有此类思想的人士,青少年时期可能受到一定的管教或遭遇变故。成年后摆脱无力感之后很容易选择用一种价值观代替原先的价值观,这对于他们来说是一种摧毁无能的过去并获得新生的仪式,并且把自身的发展归结到这种转变上,并不断自我暗示强化。

文章分三类

大部分的文章像流星一闪而过

少数的文章像彗星,多年后有人还会再回想起它们的真知灼见

极少数的文章像月亮和太阳,永恒地指引着人类前进的方向

 

———— 看 “微博学术圈” 各种言论有感

关于自然语言处理的随想

放弃了语言学特征用统计方法学习文本,现在又想用统计方法遣词造句,从熵增又到熵减,这条路仔细想想感觉不够理想。。。。一直觉得每个词的下一个词有一个概率分布这件事是很荒谬的,虽然可以勉强理解这是“多种方法表达一句话”的数学表达,但似乎是在暗示其实程序本身并不知道自己在说什么