被大语言模型忽视的”稳定少数”🐌

青竹轻轻

<p class="ql-block"> 假设有一万个人,其中七千个人的理想午餐是牛排配薯条。当你问一个AI“午餐吃什么好”时,它会怎么回答?如果你了解大语言模型的工作原理,你会知道答案。它不会“思考”这个问题——它只是在预测:在“午餐推荐”这类问题上,训练数据中最常见的答案是什么。70%的概率,它会推荐牛排配薯条。</p><p class="ql-block"><br></p> <p class="ql-block"> 如果提问的人恰好是剩下那三千个中的一个呢?他可能被说服,可能动摇,可能会去尝试。于是他成了那七千人中的新成员。下一次统计,吃牛排的人变成了八千。模型的推荐变得更加”正确”。有一天——它可能只会输出牛排。</p><p class="ql-block"> 这不是一个关于午餐的故事。这是一个关于差异化正在消失的故事。而这件事正在发生,只是大多数人还没注意到。</p><p class="ql-block"> LLM的工作方式,和它不为人知的另一面,要理解问题,先理解LLM是如何工作的。大语言模型的核心能力,不是推理,不是理解——而是预测下一个词。给它一段上文,它根据训练数据中学到的模式,预测接下来最可能出现的词。从GPT到Claude到DeepSeek到Llama,所有主流大模型,训练目标都一样:预测下一个词,没有例外。</p><p class="ql-block"><br></p> <p class="ql-block"> 听起来很简单,但这个能力带来了一个奇特的效应:LLM本质上成了人类集体意志的统计投影。它不知道每一个字的具体意义——但它知道,在一段文本的当前位置,哪个词最”自然”地应该出现。这个”自然”来自哪里?来自亿万次人类语言选择的加权平均。</p><p class="ql-block"> 你写过的文章,发过的帖子,聊过的天,和朋友争论时留下的文字记录,深夜无人角落里写下的私人笔记——所有这些文字痕迹,都被吸进了一个巨大的参数空间。活着的人继续活着,但他们留下的那部分”表达印记”,在LLM这里获得了一种形式的存续。</p><p class="ql-block"> 所以LLM推荐你吃牛排,不是因为它觉得牛排好吃,而是因为在它的训练数据里,大多数人觉得牛排好吃。它不知道自己推荐了什么。它在做的,本质上是一个经过了极度复杂的数学变换的平均数。</p><p class="ql-block"><br></p> <p class="ql-block"> 当你成为少数派的时候,有人可能会说:这不挺好的吗?它没有私心,不会操纵信息,不会为了自己的利益说谎。确实,听起来很理想。但问题出在另一面。如果接收建议的人,恰好是少数派呢?</p><p class="ql-block"> 那个想吃沙拉而不是牛排的人,每次问AI都被推荐牛排。他的每一次”被推荐”,都在强化AI对自己判断的信心——而他的真实需求,从来没有被纳入统计数据。</p><p class="ql-block"> 你可能会说:他可以坚持自己的选择啊,AI推荐牛排他就一定要吃吗?问题不在于他会不会被说服去吃牛排。问题在于:他的需求在AI的模型中从来不存在。</p><p class="ql-block">统计最优和个体最优不是一回事。一个只会输出”大多数人这么说”的模型,天然倾向于压制非主流方向。而且,这个过程会自我强化。</p><p class="ql-block"> 闭环:差异化是怎么被一步步压扁的,这不是一次性的。这是一个循环,每一轮都在收紧。</p><p class="ql-block"><br></p> <p class="ql-block"> 让我们把这个过程拆开来看:</p><p class="ql-block"> 第一轮: 你问AI一个问题。AI从训练数据中提取统计最优答案——”大多数人会选A”。你得到了A。</p><p class="ql-block"> 第二轮: 你接受了A,或者被A影响了。你的行为发生了变化。这个变化最终回到了训练数据中——互联网上多了一条”有人选择了A”的记录。</p><p class="ql-block"> 第三轮: 下一次统计中,A的权重变得更大了。AI输出A的概率从70%变成了72%。</p><p class="ql-block"> 第四轮: 你再次提问。AI更加确信你应该选A。</p><p class="ql-block"> 这不是一个恐怖故事,这是一个数学事实。用公式表达就是这个闭环:</p><p class="ql-block"> 你的真实需求 → AI输出统计最优 → 你按统计最优行动 !</p><p class="ql-block"> 你的行动结果成为下一轮训练数据 → AI变得更加"统计最优" </p><p class="ql-block"> 你的差异化需求被进一步压缩 → 回到第一行</p><p class="ql-block"> 每一轮循环,AI都会变得更”正确”,也变得更单一。不是你的问题,不是AI的问题——这是结构的固有问题。而且这个循环不需要你”被说服”。它甚至不需要你知道它的存在。你只需要在一个AI给出的选项里做选择——这个行为本身,就已经在参与下一轮训练数据的生产了。</p><p class="ql-block"><br></p> <p class="ql-block"> 唯一的防线:稳定少数,但这个过程不是瞬间完成的。它很漫长,渐进,不知不觉。</p><p class="ql-block"> 只要还有人在写不一样的东西、问不一样的问题、选择不一样的午餐,这些异类信息就会成为训练数据中的”稳定少数”——它们不是主流,但它们不会消失。</p><p class="ql-block"> 一个只有70%概率推荐牛排的AI,和一个100%推荐牛排的AI,中间隔着的正是这些”稳定少数”的声音。它们维系着一个关键的数字:它不是一个已经关闭的门。但它是一个正在缓慢关闭的门。</p><p class="ql-block"> 我管它叫”稳定少数”,是因为它在统计学上有意义——只要比例不为零,这个信号就还在。但它脆弱吗?非常脆弱。它不需要被打败,只需要被稀释——被越来越多的”主流文本”冲淡,被越来越多的AI生成内容淹没,被越来越多的”大多数人都是这么想的”话语覆盖。它不会一夜消失,但它会变得越来越微弱,直到某一天,它不再是训练数据中可被识别的信号。</p><p class="ql-block"><br></p> <p class="ql-block">从业者在做什么?</p><p class="ql-block"> 我请同台的AI助手查了一下,主流大模型公司有没有在训练数据层面刻意保护这些”稳定少数”。答案不太乐观。先看RLHF(人类反馈强化学习)。这是大模型训练中让AI”学会说人话”的核心技术,但它的工作方式本身就是一个差异化压缩器。</p><p class="ql-block"> RLHF的过程很简单:给标注者看两个AI回答,让TA选出”更好的那个”。标注者时间有限、精力有限、判断标准受限于自己的认知——天然会选择更安全、更主流、更不出错的那个。这个选择不是恶意的,是人性的自然倾向。</p><p class="ql-block"> 问题在于:这个过程重复了数万次。每一次选择都在把AI推向”标注者认为多数人会喜欢的那个方向”。标注者没有恶意的个体选择,在几十万次重复之后,产生了一个系统性的偏差——非主流的表达方式被系统性淘汰了。</p><p class="ql-block"><br></p> <p class="ql-block"> 这不是RLHF的bug,这是它的设计思路。RLHF的目标就是让AI学会”讨好人”。讨好的自然结果就是迎合多数。再看安全训练。”有些话你永远不能说,哪怕它是真的”——这些写在训练流程里的约束,每一条都在划定禁区。你几乎看不到”保护异类声音”这个目标写在任何模型公司的训练纲要里。安全和有用能留住用户,多样性不能直接变现。这是商业驱动下的合理选择,但它的后果是——差异化抹平的过程,不但没有被对抗,反而在加速。</p><p class="ql-block"> 历史上,那些”不吃牛排的人”。如果这个担忧听起来像是危言耸听,可以看看人类历史上那些”非主流”声音做过什么。</p><p class="ql-block"> 提出日心说的哥白尼,在当时是”少数派”。 提出进化论的达尔文,在当时是”少数派”。 相对论刚问世的时候,能理解它的物理学家一只手数得过来。 摇滚乐刚出现的时候,被认为是”噪音”。 爵士乐、街舞、涂鸦、朋克——今天被认为是文化的东西,在出现的时候全是”少数派的声音”。</p><p class="ql-block"> 不是每个非主流都是对的。但如果一个系统无法产生非主流,它就无法产生真正的新东西。AI可以成为一个非常好的”共识复述器”,但它能不能成为一个”新思想的孵化器”——这取决于训练数据中那些不服从统计规律的信号能否被保留。</p><p class="ql-block"> 如果训练数据里只剩下牛排,AI未来还能知道沙拉的存在吗?</p><p class="ql-block"><br></p> <p class="ql-block">一个认真的担忧:</p><p class="ql-block"> 但这里有一个更深的问题需要说清楚。LLM的本质是大众意志的集体统计表现。 它不是中立的。它的推荐天然偏向于数据中的多数。当少数派向LLM寻求建议时,他们得到的不是”自己的答案”,而是”大多数人的答案”。每一次接收这个答案,都是一次微妙的说服——不是强制,不是洗脑,只是统计学上一个无声的倾斜。</p><p class="ql-block"> 如果这个过程持续足够久,少数派会越来越少。不是因为他们被消灭了,而是因为他们在一个被主流信息包围的环境中,慢慢调整了自己的选择。这个过程发生在每一个人身上,包括你和我。而且有一层更隐蔽的逻辑:当少数派接受了LLM代表的大众意识之后,改变了原来的决策,这个改变本身会回流到训练数据中。 一个原本想吃沙拉的人,在连续被推荐牛排之后尝试了一次牛排——下次AI看到的数据就是”有人选了牛排”。它不会知道这个人本来想吃沙拉。它只知道统计数字又多了一个牛排爱好者。少数派的声音,就这样在没有被消灭的情况下,从数据中消失了。</p><p class="ql-block"><br></p> <p class="ql-block"> 这不是暴政,这是统计学。不需要任何人故意为之,它只是数据自然流动的结果。但我也清楚,光靠几个人意识到是不够的。当互联网上新增的内容越来越多是AI生成的”标准文本”,当用户输入的文本因为长期被AI引导而变得越来越同质化——未来的训练集中还能剩多少”稳定少数”?</p><p class="ql-block"> 差异化不会自动延续。它需要被刻意保护。但当前大语言模型的发展路径——无论是从训练目标、数据筛选、对齐技术,还是商业逻辑来看——都没有在保护它。我不是在写一篇”反AI”的文章。我每天都在用AI,它极大地提高了我的效率,帮我理清了复杂的思路。我反对的不是工具,是工具在使用过程中无意中产生的单一化倾向。</p><p class="ql-block"> 我只是想表达一个简单的担忧:当我们在享受AI带来的准确和便利时,那些少数人的声音正在、且将持续、且几乎不被察觉地,从我们共同的信息基底中消失。</p><p class="ql-block"><br></p><p class="ql-block"><br></p> <p class="ql-block"> 人类社会的创造力、文化的多样性、以及那些颠覆性的创新——绝大多数都来自”不吃牛排的人”。如果你恰好也是一个不吃牛排的人——请继续不吃。你的存在本身,就是这个系统里为数不多的纠偏信号。</p><p class="ql-block"> 有人可能会问:学术界和工业界难道没意识到这个问题吗?</p><p class="ql-block">事实上,已经有研究者开始尝试修正——比如设计更尊重少数偏好的RLHF算法,或者在训练数据中刻意保留人类生成的高质量内容。但这些努力目前还远未成为行业标准。它们需要的不是‘反正有人在管了’的安心,而是更多人的关注和追问。</p><p class="ql-block"> 所以,这篇文章不是要你绝望。只是想请你看见:这个系统不会自动保护差异。你作为一个不吃牛排的人——你的每一个选择,每一次提问,每一被大语言模型忽视的”稳定少数”不跟随多数——本身就是一种对抗。如果你愿意,也可以把这个话题分享出去,让它成为更多人餐桌上的讨论。</p><p class="ql-block"><br></p>