大语言模型的局限性

发表于 2025-08-06 分类于日记

道德经的开头一句是：道可道，非常道，名可名，非常名。

这句话非常深奥，是道德经的总纲。体现了老子对世界的认知。第一个“道”是名词，代表世界运行的规律，第二个“道”是动词，说的意思，“常道”则是世界运行背后的终极规律。同样第一个“名”是名词，代表你想说的一种东西，第二个“名”是动词，对你想说的那种东西的命名。“常名”则是你想说的那种东西的真正面目。

所以这句话通俗的理解就是：能说出来的规律，就不是世界运行的真正的规律，世界的本源是不可言说的。能命名的东西，并不是那东西的全部，只是那个东西的一个侧面。这犹如禅宗的不可言说，一说就错。也说明语言的局限性，并不能通过语言描述这个真正的世界。

这种理解还是很抽象，说到语言就想到一种更直观的类比。把现在的大语言模型看成是“道”，人们对这个“道”的理解还非常的表面，里面亿万的参数的权重代表什么意思，没有人知道，一个参数的权重为什么是0.306,而不是0.307,没有人知道。为什么数量大到一定级别，就会涌现出智慧，没有人知道。说明这里面的运行机制是不可说的，说出来的都不是真正的机制。比如说注意力机制，比如说要分多少层，比如说要多少级别的参数，比如说训练调参分成多个专家系统，这些都不是这个机制本身，只是反应这个机制的很小的一部分规律。

可以说大语言模型是个优秀的音频，视频生成器，也可以说是个优秀的推理模型，甚至可以说是个情感专家，但这些都不是大语言模型本身。也仅仅是描述它的一个侧面。

这样是不是好理解多了。

但是，正因为语言的局限，现在以人类语言训练的模型，并不能形成真正的智能，仅仅是个工具而已。可以理解成是人类现有的知识在一个多维向量空间的映射，从而方便我们检索。真正的智能需要机器能够脱离语言的限制，开始理解世界时，那时才是真正人工智能的起点。