放弃了语言学特征用统计方法学习文本,现在又想用统计方法遣词造句,从熵增又到熵减,这条路仔细想想感觉不够理想。。。。一直觉得每个词的下一个词有一个概率分布这件事是很荒谬的,虽然可以勉强理解这是“多种方法表达一句话”的数学表达,但似乎是在暗示其实程序本身并不知道自己在说什么
放弃了语言学特征用统计方法学习文本,现在又想用统计方法遣词造句,从熵增又到熵减,这条路仔细想想感觉不够理想。。。。一直觉得每个词的下一个词有一个概率分布这件事是很荒谬的,虽然可以勉强理解这是“多种方法表达一句话”的数学表达,但似乎是在暗示其实程序本身并不知道自己在说什么