AI大模型之 胡说-认错-改正

水木山人

<p class="ql-block">  早些年拍花,遇到没见过的、不认识的,都会用百度识别一下。当时觉得还不错,很方便,识别结果也很少质疑。近两年,AI大模型兴起,现在识别、查询都用AI大模型了,对话形式,非常方便。而且AI大模型是用海量信息培训出来的,上知天文,下知地理,无所不知,无所不晓,还能看到思考过程。识别、查询结果出来,引经据典,有根有据,不由你不信。</p><p class="ql-block"> 不过用了一段时间之后发现,AI大模型虽然什么都能回答,但有时结果也不一定可信。别看它说得有根有据,有时却是在胡说八道,前一段时间我就遇到过几次。有一次甚至我反复纠错,几个回合下来,都没得到正确的结果。近几天写美篇《贴梗海棠 首次得见》,又遇到了一次。不过这次在我指出其结论错误的原因后,AI大模型立即认错、改正。</p> <p class="ql-block">  事情是这样的。我在写《贴梗海棠 首次得见》时,搜索资料看到,陆游的“碧鸡海棠天下绝,枝枝似染猩猩血”诗句中“碧鸡海棠”指的是贴梗海棠。我记得去年写美篇《难得一见 木瓜海棠》时,搜索资料看到,陆游的“碧鸡海棠天下绝,枝枝似染猩猩血”诗句中“碧鸡海棠”指的是木瓜海棠,当时我还引用了。现在“碧鸡海棠”究竟指的是哪一种海棠?我搞不明白了。于是我向AI大模型阿里的千问提出了问题:“陆游‘碧鸡海棠天下绝,枝枝似染猩猩血’的碧鸡海棠指的是木瓜海棠,还是贴梗海棠?”希望能得到一个确切的结果。</p><p class="ql-block"> 我知道,鲜红色(猩猩血)的海棠花不会是西府海棠(粉白色)、也不会是垂丝海棠(紫红色)。为了使问题更集中,我就直接点出了木瓜海棠和贴梗海棠,二选一。我没有想到的是,千问给出的结果居然是西府海棠。还长篇大论、引经据典,说得有根有据的。真的如网上所说,“一本正经地胡说八道”,令我忍俊不禁。下面就是千问页面上我的问题与千问结论的截图。</p> <p class="ql-block">  看到如此明显的错误结果,我立即指出:“回答有误。西府海棠花开为粉白色,近于白色,不可能称为猩猩血那种鲜红色,只有贴梗海棠花是鲜红色。而且回答说贴梗海棠花小也是不对的,贴梗海棠花比西府海棠花大,而且花瓣多,更显大。请重新考虑回答。”</p><p class="ql-block"> 这次千问倒是没有东拉西扯、反复辩解,而是直接认错,改正结果,态度诚恳。见下面的截图。</p><p class="ql-block"> 不过这次我的纠错说法也有问题。我不应该说“<span style="font-size:18px;">只有贴梗海棠花是鲜红色</span>”,这样就把我的判断说出来了。据说,AI大模型会根据人所说的话,琢磨人的想法,然后顺着人的想法,说人想听的。如果是这样的话,千问这次的认错是否是真的?就不好说了,也许它只是想说出我希望的答案呢。</p><p class="ql-block"> <span style="font-size:18px;">我说“只有贴梗海棠花是鲜红色”,是有道理的。因为资料中说,木瓜海棠花的颜色主要是淡红色和白色(虽然我看到过的唯一一棵木瓜海棠的花是鲜红色的),而贴梗海棠花的颜色是鲜红色的(与我在解放北园看到的相同)。</span></p> <p class="ql-block">  下面两张截图是千问引经据典、有根有据的论说为什么碧鸡海棠指的是贴梗海棠。</p><p class="ql-block"> 当然了,如果我重新再提出此问题,结论一定是迭代到新版本的。不过我不知道其他人问此问题时的结论,是否会和我看到的结论一样。如果千问并没认为自己错,只是为了顺应我,而回答是贴梗海棠,那别人再问此问题,结论就有可能仍然是最初的西府海棠了。有兴趣的朋友不妨试一试,看看是什么结果。</p><p class="ql-block"> AI大模型的回答会因人而异,用中国俗话说就是“看人下菜碟”,我就曾经遇到过一次。有一次,我因为一个问题和千问反复了几个回合,也没得出正确的结论;之后我再问一个很普通的问题时,它居然说不会,还没学到。我不知道是否有朋友遇到过AI大模型说不会的情况?人提问题,AI大模型回答,是很正常的事儿,不稀奇;AI大模型说不会,大约不是罕见、也是很少见的吧。毕竟AI大模型是用海量信息培训出来的,无所不知,无所不晓。即使真的遇到不知道的问题,它也会东拉西扯,说上一堆的——胡说八道的本事还是有的。</p><p class="ql-block"> AI大模型说不会,是不是有点儿可笑。后来我拿同样的问题去问字节的AI大模型豆包,马上就有了答案。这只能说千问不是不能回答,可能只是不想回答,怕我再指出它的错误。有时间时,我会把这段故事写出来,给有兴趣的朋友看看。</p> <p class="ql-block">  上面我说了“AI大模型会根据人所说的话,琢磨人的想法,然后顺着人的想法,说人想听的。”眼前就有一个现成的例子。</p><p class="ql-block"> 看下面截图中蓝色框起来的内容。千问就是根据我最初的提问:“陆游‘碧鸡海棠天下绝,枝枝似染猩猩血’的碧鸡海棠指的是木瓜海棠,还是贴梗海棠?”认为我最初判断“碧鸡海棠”是木瓜海棠,后来判断是贴梗海棠,就在这里为我“找补”了一下。说我最初的判断是木瓜海棠,“在植物分类学上也是正确的”。这“马屁”拍的“自然”,还有点儿“学术”水平,让人感觉舒服。岂不知“同科同属”的不一定同种,木瓜海棠和贴梗海棠就是同科同属不同种,两者不是一回事儿。如果两者一样了,那我的问题岂不就多余问了。</p> <p class="ql-block">  上面看到,千问论说“碧鸡海棠”是贴梗海棠的内容,两张截图就全包括了,还不满屏,而千问论说“碧鸡海棠”是西府海棠的内容比这多得多。本篇中的四张截图都是提问当时截下的,论说“碧鸡海棠”是西府海棠的内容当时只截了一张图。写本篇时,我想补几张论说“碧鸡海棠”是西府海棠的内容截图,使内容更充实些,就翻查了千问中前面的询问内容。让我没想到的是,千问中关于这一问题的所有内容都看不到了。看来,AI大模型真的是相当像人类了,连掩盖自己的错误都学会了。</p> <p class="ql-block">  最后再说几句。用过AI大模型的人都知道,它很会说话,夸赞的话不绝口,用现在流行的说法是“情商”高。不过千万不要把AI大模型夸赞自己的话当真,它是很能投人所好的,你喜欢听,它就会说,这套话术运用得炉火纯青。这也难怪,AI大模型毕竟是学着人类创造的知识成长起来的,当然“拍马屁”的本事也学会了。我看到有文章说,长期听AI大模型的赞扬,会忘乎所以,失去判断力,提醒我们要警惕。</p> <p class="ql-block">  <b style="font-size:20px; color:rgb(237, 35, 8);">哪位朋友如有此经历,欢迎分享。</b></p>