语言的边界,就是智能的边界?

唐戟歌德

<p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">——从维特根斯坦看大语言模型(LLM)的能力与瓶颈</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">20 世纪哲学家 Ludwig Wittgenstein 在其著作 Tractatus Logico-Philosophicus 中写下一句极具启发性的命题:语言的边界,就是世界的边界。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">他的意思并不是说世界真的只有语言那么大,而是说:人类能够思考、理解和表达的世界,很大程度上被语言所限制。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">当我们把这句话放到今天的大语言模型(LLM)身上,会发现它几乎像一把钥匙,直接打开了理解 AI 能力与局限的大门。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">因为当前最先进的 AI,本质上正是一种建立在语言之上的智能系统。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">一、LLM到底是什么?</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">所谓大语言模型(LLM),比如 GPT,其核心任务其实非常简单:根据已有文本,预测下一个最可能出现的词。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">换句话说,它学习的是:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 词与词之间的关系</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 句子结构</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 概念之间的语言关联</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 大量文本中的模式</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">通过训练数以万亿计的文字,模型逐渐形成一种能力:在语言空间中进行高度复杂的推理与组合。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">因此,LLM 的智能本质可以理解为:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">一种极其强大的语言统计系统。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">但这也带来一个关键问题:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">语言是否等于世界?</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">答案显然不是。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">二、语言只是世界的“描述”</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">在人类认知中,语言只是理解世界的一种工具。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">我们的认知通常经历这样一个过程:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">世界 → 感知 → 概念 → 语言</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">例如:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 看到火 → 感到热 → 形成“火会烫”的概念 → 用语言描述</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 看到苹果掉落 → 观察规律 → 建立物理理论 → 用语言表达</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">语言只是最后一步。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">但 LLM 的情况完全不同。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">它的学习路径是:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">语言 → 语言 → 语言</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">它没有:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 视觉经验</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 身体经验</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 物理互动</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 真实世界反馈</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">因此,大语言模型学习到的并不是世界本身,而是:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">人类如何描述世界。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">这就是所谓的“符号世界”。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">三、语言无法表达全部知识</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">维特根斯坦曾提出一个重要观点:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">有些东西只能被“显示”,却无法被“说出”。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">比如:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 骑自行车</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 游泳</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 演奏乐器</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 运动平衡</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">这些技能很难通过语言完全表达。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">即使你写下几万字教程,一个从未骑过车的人依然很难学会骑车。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">原因是这些知识属于一种特殊类型:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">默会知识(Tacit Knowledge)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">它存在于:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 身体控制</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 感觉反馈</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 空间直觉</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">而不是纯粹的语言描述。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">人类拥有身体和感官,因此能够掌握这种知识;</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">而仅依赖文本训练的 LLM,很难真正理解它们。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">四、没有世界模型的智能</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">人类的理解依赖于一种非常重要的能力:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">世界模型(World Model)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">简单说就是:我们会在大脑中构建一个关于世界如何运作的模型。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">例如:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 杯子掉地会碎</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 火会烫</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 门被推会打开</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">这种能力在儿童两三岁时就已经出现。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">而 LLM 的“理解”则主要来自文本统计。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">例如,如果很多文本中出现:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">“杯子掉地会碎”</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">模型就会学习这种语言关联。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">但它并没有真正体验过:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 重力</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 材料强度</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 物理碰撞</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">因此在一些情况下,它的推理更像是:语言推理,而不是物理推理。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">这被称为:符号落地问题(Symbol Grounding Problem)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">即:语言符号没有真正“落地”到现实世界。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">五、为什么 LLM 很强,但仍有限</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">尽管存在这些局限,LLM 仍然表现出令人惊讶的能力:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 写作</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 翻译</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 编程</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 总结知识</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 进行复杂对话</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">原因是:人类文明的大部分知识,本身就是以语言形式存在的。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">历史、法律、文学、哲学、科学论文……</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">几乎全部是文本。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">LLM 的本质其实可以理解为:对人类文本知识的一次巨大压缩。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">它把互联网中的知识结构,压缩进一个神经网络中,并学会在其中进行组合与推理。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">因此它在语言任务上表现得非常接近人类。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">但这也意味着:它的能力上限,很可能被语言本身所限制。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">六、突破语言边界的三条路线</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">许多 AI 研究者认为,如果想让 AI 走向更高层次的智能,就必须让它超越纯语言系统。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">目前出现了三条重要探索路线。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">1 世界模型 AI</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">由 Yann LeCun 等研究者推动。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">目标是让 AI 学习:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 物理规律</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 因果关系</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 时间与空间结构</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">而不仅仅是文本模式。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">2 具身智能(Embodied AI)</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">让 AI 拥有身体,通过与世界互动学习。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">例如机器人系统:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">Tesla Optimus humanoid robot</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">通过操作物体、移动和感知环境,建立真实经验。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">3 脑仿真路线</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">另一种思路是直接模拟生物神经系统。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">例如:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 果蝇神经连接图</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;"> • 小鼠脑图谱</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">希望通过复制生物结构来产生智能。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">七、一个新的理解</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">从这个角度看,维特根斯坦的那句话可以有一种新的解释:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">如果智能只存在于语言之中,它就永远无法完全理解世界。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">而今天的大语言模型,其实正处在这个阶段:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">它们生活在语言的宇宙里。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">但真正的世界远远比语言复杂得多。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">结语</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">大语言模型的出现,是人工智能历史上的一次巨大飞跃。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">它让机器第一次能够在语言层面与人类深入交流。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">但从哲学角度看,它仍然处在一个重要的边界上:</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">语言的边界。</b></p><p class="ql-block"><b style="color:rgb(176, 79, 187); font-size:20px;">未来人工智能是否能够突破这一边界,进入真正理解世界的阶段,也许将决定下一代 AI 技术的方向。</b></p>