大语言模型的局限性

道德经的开头一句是:道可道,非常道,名可名,非常名。

这句话非常深奥,是道德经的总纲。体现了老子对世界的认知。第一个“道”是名词,代表世界运行的规律,第二个“道”是动词,说的意思,“常道”则是世界运行背后的终极规律。同样第一个“名”是名词,代表你想说的一种东西,第二个“名”是动词,对你想说的那种东西的命名。“常名”则是你想说的那种东西的真正面目。

所以这句话通俗的理解就是:能说出来的规律,就不是世界运行的真正的规律,世界的本源是不可言说的。能命名的东西,并不是那东西的全部,只是那个东西的一个侧面。这犹如禅宗的不可言说,一说就错。也说明语言的局限性,并不能通过语言描述这个真正的世界。

这种理解还是很抽象,说到语言就想到一种更直观的类比。把现在的大语言模型看成是“道”,人们对这个“道”的理解还非常的表面,里面亿万的参数的权重代表什么意思,没有人知道,一个参数的权重为什么是0.306,而不是0.307,没有人知道。为什么数量大到一定级别,就会涌现出智慧,没有人知道。说明这里面的运行机制是不可说的,说出来的都不是真正的机制。比如说注意力机制,比如说要分多少层,比如说要多少级别的参数,比如说训练调参分成多个专家系统,这些都不是这个机制本身,只是反应这个机制的很小的一部分规律。

可以说大语言模型是个优秀的音频,视频生成器,也可以说是个优秀的推理模型,甚至可以说是个情感专家,但这些都不是大语言模型本身。也仅仅是描述它的一个侧面。

这样是不是好理解多了。

但是,正因为语言的局限,现在以人类语言训练的模型,并不能形成真正的智能,仅仅是个工具而已。可以理解成是人类现有的知识在一个多维向量空间的映射,从而方便我们检索。真正的智能需要机器能够脱离语言的限制,开始理解世界时,那时才是真正人工智能的起点。