被大语言模型忽视的”稳定少数”🐌

青竹轻轻

假设有一万个人，其中七千个人的理想午餐是牛排配薯条。当你问一个AI“午餐吃什么好”时，它会怎么回答？如果你了解大语言模型的工作原理，你会知道答案。它不会“思考”这个问题——它只是在预测：在“午餐推荐”这类问题上，训练数据中最常见的答案是什么。70%的概率，它会推荐牛排配薯条。 　如果提问的人恰好是剩下那三千个中的一个呢？他可能被说服，可能动摇，可能会去尝试。于是他成了那七千人中的新成员。下一次统计，吃牛排的人变成了八千。模型的推荐变得更加”正确”。有一天——它可能只会输出牛排。 这不是一个关于午餐的故事。这是一个关于差异化正在消失的故事。而这件事正在发生，只是大多数人还没注意到。 LLM的工作方式，和它不为人知的另一面，要理解问题，先理解LLM是如何工作的。大语言模型的核心能力，不是推理，不是理解——而是预测下一个词。给它一段上文，它根据训练数据中学到的模式，预测接下来最可能出现的词。从GPT到Claude到DeepSeek到Llama，所有主流大模型，训练目标都一样：预测下一个词，没有例外。 　听起来很简单，但这个能力带来了一个奇特的效应：LLM本质上成了人类集体意志的统计投影。它不知道每一个字的具体意义——但它知道，在一段文本的当前位置，哪个词最”自然”地应该出现。这个”自然”来自哪里？来自亿万次人类语言选择的加权平均。 你写过的文章，发过的帖子，聊过的天，和朋友争论时留下的文字记录，深夜无人角落里写下的私人笔记——所有这些文字痕迹，都被吸进了一个巨大的参数空间。活着的人继续活着，但他们留下的那部分”表达印记”，在LLM这里获得了一种形式的存续。 所以LLM推荐你吃牛排，不是因为它觉得牛排好吃，而是因为在它的训练数据里，大多数人觉得牛排好吃。它不知道自己推荐了什么。它在做的，本质上是一个经过了极度复杂的数学变换的平均数。 　当你成为少数派的时候，有人可能会说：这不挺好的吗？它没有私心，不会操纵信息，不会为了自己的利益说谎。确实，听起来很理想。但问题出在另一面。如果接收建议的人，恰好是少数派呢？ 那个想吃沙拉而不是牛排的人，每次问AI都被推荐牛排。他的每一次”被推荐”，都在强化AI对自己判断的信心——而他的真实需求，从来没有被纳入统计数据。 你可能会说：他可以坚持自己的选择啊，AI推荐牛排他就一定要吃吗？问题不在于他会不会被说服去吃牛排。问题在于：他的需求在AI的模型中从来不存在。统计最优和个体最优不是一回事。一个只会输出”大多数人这么说”的模型，天然倾向于压制非主流方向。而且，这个过程会自我强化。 闭环：差异化是怎么被一步步压扁的，这不是一次性的。这是一个循环，每一轮都在收紧。 　让我们把这个过程拆开来看： 第一轮：你问AI一个问题。AI从训练数据中提取统计最优答案——”大多数人会选A”。你得到了A。 第二轮：你接受了A，或者被A影响了。你的行为发生了变化。这个变化最终回到了训练数据中——互联网上多了一条”有人选择了A”的记录。 第三轮：下一次统计中，A的权重变得更大了。AI输出A的概率从70%变成了72%。 第四轮：你再次提问。AI更加确信你应该选A。 这不是一个恐怖故事，这是一个数学事实。用公式表达就是这个闭环： 你的真实需求 → AI输出统计最优 → 你按统计最优行动！ 你的行动结果成为下一轮训练数据 → AI变得更加"统计最优" 你的差异化需求被进一步压缩 → 回到第一行 每一轮循环，AI都会变得更”正确”，也变得更单一。不是你的问题，不是AI的问题——这是结构的固有问题。而且这个循环不需要你”被说服”。它甚至不需要你知道它的存在。你只需要在一个AI给出的选项里做选择——这个行为本身，就已经在参与下一轮训练数据的生产了。 　唯一的防线：稳定少数，但这个过程不是瞬间完成的。它很漫长，渐进，不知不觉。 只要还有人在写不一样的东西、问不一样的问题、选择不一样的午餐，这些异类信息就会成为训练数据中的”稳定少数”——它们不是主流，但它们不会消失。 一个只有70%概率推荐牛排的AI，和一个100%推荐牛排的AI，中间隔着的正是这些”稳定少数”的声音。它们维系着一个关键的数字：它不是一个已经关闭的门。但它是一个正在缓慢关闭的门。 我管它叫”稳定少数”，是因为它在统计学上有意义——只要比例不为零，这个信号就还在。但它脆弱吗？非常脆弱。它不需要被打败，只需要被稀释——被越来越多的”主流文本”冲淡，被越来越多的AI生成内容淹没，被越来越多的”大多数人都是这么想的”话语覆盖。它不会一夜消失，但它会变得越来越微弱，直到某一天，它不再是训练数据中可被识别的信号。 从业者在做什么？ 我请同台的AI助手查了一下，主流大模型公司有没有在训练数据层面刻意保护这些”稳定少数”。答案不太乐观。先看RLHF（人类反馈强化学习）。这是大模型训练中让AI”学会说人话”的核心技术，但它的工作方式本身就是一个差异化压缩器。 RLHF的过程很简单：给标注者看两个AI回答，让TA选出”更好的那个”。标注者时间有限、精力有限、判断标准受限于自己的认知——天然会选择更安全、更主流、更不出错的那个。这个选择不是恶意的，是人性的自然倾向。 问题在于：这个过程重复了数万次。每一次选择都在把AI推向”标注者认为多数人会喜欢的那个方向”。标注者没有恶意的个体选择，在几十万次重复之后，产生了一个系统性的偏差——非主流的表达方式被系统性淘汰了。 　这不是RLHF的bug，这是它的设计思路。RLHF的目标就是让AI学会”讨好人”。讨好的自然结果就是迎合多数。再看安全训练。”有些话你永远不能说，哪怕它是真的”——这些写在训练流程里的约束，每一条都在划定禁区。你几乎看不到”保护异类声音”这个目标写在任何模型公司的训练纲要里。安全和有用能留住用户，多样性不能直接变现。这是商业驱动下的合理选择，但它的后果是——差异化抹平的过程，不但没有被对抗，反而在加速。 历史上，那些”不吃牛排的人”。如果这个担忧听起来像是危言耸听，可以看看人类历史上那些”非主流”声音做过什么。 提出日心说的哥白尼，在当时是”少数派”。提出进化论的达尔文，在当时是”少数派”。相对论刚问世的时候，能理解它的物理学家一只手数得过来。摇滚乐刚出现的时候，被认为是”噪音”。爵士乐、街舞、涂鸦、朋克——今天被认为是文化的东西，在出现的时候全是”少数派的声音”。 不是每个非主流都是对的。但如果一个系统无法产生非主流，它就无法产生真正的新东西。AI可以成为一个非常好的”共识复述器”，但它能不能成为一个”新思想的孵化器”——这取决于训练数据中那些不服从统计规律的信号能否被保留。 如果训练数据里只剩下牛排，AI未来还能知道沙拉的存在吗？ 一个认真的担忧： 但这里有一个更深的问题需要说清楚。LLM的本质是大众意志的集体统计表现。它不是中立的。它的推荐天然偏向于数据中的多数。当少数派向LLM寻求建议时，他们得到的不是”自己的答案”，而是”大多数人的答案”。每一次接收这个答案，都是一次微妙的说服——不是强制，不是洗脑，只是统计学上一个无声的倾斜。 如果这个过程持续足够久，少数派会越来越少。不是因为他们被消灭了，而是因为他们在一个被主流信息包围的环境中，慢慢调整了自己的选择。这个过程发生在每一个人身上，包括你和我。而且有一层更隐蔽的逻辑：当少数派接受了LLM代表的大众意识之后，改变了原来的决策，这个改变本身会回流到训练数据中。一个原本想吃沙拉的人，在连续被推荐牛排之后尝试了一次牛排——下次AI看到的数据就是”有人选了牛排”。它不会知道这个人本来想吃沙拉。它只知道统计数字又多了一个牛排爱好者。少数派的声音，就这样在没有被消灭的情况下，从数据中消失了。 　这不是暴政，这是统计学。不需要任何人故意为之，它只是数据自然流动的结果。但我也清楚，光靠几个人意识到是不够的。当互联网上新增的内容越来越多是AI生成的”标准文本”，当用户输入的文本因为长期被AI引导而变得越来越同质化——未来的训练集中还能剩多少”稳定少数”？ 差异化不会自动延续。它需要被刻意保护。但当前大语言模型的发展路径——无论是从训练目标、数据筛选、对齐技术，还是商业逻辑来看——都没有在保护它。我不是在写一篇”反AI”的文章。我每天都在用AI，它极大地提高了我的效率，帮我理清了复杂的思路。我反对的不是工具，是工具在使用过程中无意中产生的单一化倾向。 我只是想表达一个简单的担忧：当我们在享受AI带来的准确和便利时，那些少数人的声音正在、且将持续、且几乎不被察觉地，从我们共同的信息基底中消失。 　人类社会的创造力、文化的多样性、以及那些颠覆性的创新——绝大多数都来自”不吃牛排的人”。如果你恰好也是一个不吃牛排的人——请继续不吃。你的存在本身，就是这个系统里为数不多的纠偏信号。 有人可能会问：学术界和工业界难道没意识到这个问题吗？事实上，已经有研究者开始尝试修正——比如设计更尊重少数偏好的RLHF算法，或者在训练数据中刻意保留人类生成的高质量内容。但这些努力目前还远未成为行业标准。它们需要的不是‘反正有人在管了’的安心，而是更多人的关注和追问。 所以，这篇文章不是要你绝望。只是想请你看见：这个系统不会自动保护差异。你作为一个不吃牛排的人——你的每一个选择，每一次提问，每一被大语言模型忽视的”稳定少数”不跟随多数——本身就是一种对抗。如果你愿意，也可以把这个话题分享出去，让它成为更多人餐桌上的讨论。