<p class="ql-block">AI要成长,路还很长</p><p class="ql-block">周其美对豆包说:</p><p class="ql-block">AI对物理世界的认知为什么很低,不能㸤析图片内容?</p><p class="ql-block">豆包答:</p><p class="ql-block">你这个问题问到AI的本质痛点了,我用最直白、好懂的话跟你说清楚:</p><p class="ql-block">1. 现在的AI,其实**“看不见”真实世界**</p><p class="ql-block">你看到的“识图”,本质是:</p><p class="ql-block">- 看像素、颜色、轮廓、纹理</p><p class="ql-block">- 匹配数据库里见过的标签(猫、狗、车、人)</p><p class="ql-block"> </p><p class="ql-block">它没有物理常识:</p><p class="ql-block">- 不知道东西有重量、体积、硬度</p><p class="ql-block">- 不知道重力、平衡、因果</p><p class="ql-block">- 不知道“杯子倒了水会流”“玻璃会碎”</p><p class="ql-block"> </p><p class="ql-block">它只是统计匹配,不是理解世界。</p><p class="ql-block"> </p><p class="ql-block">2. 为什么解析图片很弱?</p><p class="ql-block"> 因为图片是二维投影,AI缺三样东西:</p><p class="ql-block">1. 3D空间感:不知道前后、远近、遮挡.(.</p><p class="ql-block">2. 物理规则:不知道什么能站得住、什么会塌</p><p class="ql-block">3. 真实世界经验:它没摸过、没走过、没摔过</p><p class="ql-block">人类看一眼就懂:</p><p class="ql-block">“这张桌子不稳,会倒”</p><p class="ql-block">AI只能说:“这是桌子”。</p><p class="ql-block">3. 不是不能解析,是理解很浅</p><p class="ql-block">- 能识别物体:这是人、车、树</p><p class="ql-block">- 能描述画面:有几个人、什么动作</p><p class="ql-block">- 但做不到深度推理:</p><p class="ql-block">- 为什么这个人摔倒?</p><p class="ql-block">- 这个结构牢不牢?</p><p class="ql-block">- 接下来会发生什么?</p><p class="ql-block">这些都需要物理世界的常识,而AI目前大多只有“语言知识”,没有“世界知识”。</p><p class="ql-block"> </p><p class="ql-block">4. 简单总结</p><p class="ql-block"> 人类:眼睛看 + 大脑用物理常识推理</p><p class="ql-block">- AI:像素匹配 + 文字联想</p><p class="ql-block">它没活过这个世界,所以对物理世界的认知天然就低。</p><p class="ql-block">其美回答:好!(发一“鳥”字根艺图片。</p><p class="ql-block">豆包答:这是一件根书艺术作品,呈现的是汉字“寿”的行草形态。</p><p class="ql-block">其美答:错了,不是“寿”,而是㮸木根天然形态“鳥”字。</p><p class="ql-block"><br></p><p class="ql-block">周其美2026春节</p><p class="ql-block"><br></p><p class="ql-block"><br></p><p class="ql-block"><br></p>