我的教育随想(五十五):与一位专家和他的A|数字人解逅

老顽童

<p class="ql-block">我和专家刘荣青一起聊未来教育,想听听他的高见。他笑而不答,却用手机播放了一段短视频,视频上的他正侃侃而谈。我原以为是他在某次会议上的发言录像,然而他说不是,是他的“替身——模拟人(我的称呼)”正按他的指令在会上发言,这让我十分吃惊。他却平和地告诉我:“这是AI专家塑造出的替身,能用他的语言根据他的想法回答别人提出的问题。”</p><p class="ql-block"> </p><p class="ql-block">吃惊之余,我不忘向他请教:“这种‘模拟人’的培养很难吗?”他回答,比较难。他接着介绍了用AI技术塑造一个人的困难之所在。听了以后,似懂非懂的我,便打开工具向其提出问题寻求解答。</p><p class="ql-block"> </p><p class="ql-block">问题</p><p class="ql-block"> 先请帮我纠正提问中不科学之处,再用通俗语言(可打比方)回答问题,谢谢!具体问题如下:①训练一个能有思想、会回答问题的替身,这个替身在AI里是否称为模拟人?或者行业内怎么称呼它?②训练这个替身是否也算是训练一个模型?③训练这个替身用什么算法?④训练一个这样的替身难度大吗?</p><p class="ql-block"> </p><p class="ql-block">问题解答(为便于理解,解答文字经删改)</p><p class="ql-block"> ① AI里这类替身的称呼</p><p class="ql-block">它不算“模拟人”,行业里常叫AI数字人,也叫AI克隆人。</p><p class="ql-block"> ② 训练这个替身是否算训练模型</p><p class="ql-block">算。AI替身本质就是一个被定制化训练的AI模型,就像训练一个专属的智能机器人,要给它输入大量和真人相关的数据,让它学习真人的思维方式和表达习惯,这个过程就是模型训练。</p><p class="ql-block"> ③ 训练所用的算法</p><p class="ql-block">核心是大语言模型相关算法,还会用到深度学习算法。讲得通俗一点,这就像做饭,大语言模型算法是主食材,其他算法是调料,搭配起来才能做出“和真人相似”的效果。</p><p class="ql-block"> ④ 训练的难度</p><p class="ql-block">难度比较大。一方面,需要海量的真人数据(比如发言、文章、对话记录),还要保证数据质量;另一方面,要让AI替身精准模仿真人的思维和语气,就像让演员模仿另一个人的一举一动甚至内心想法,不仅要学表面,还要抓核心,而且还要解决对话卡顿、情绪表达不自然等问题,对技术和数据的要求都很高。</p><p class="ql-block"> </p><p class="ql-block">我忽然想起生活中常遇到的一些事。现在,当你遇事要和某大机构电话沟通时,回答你提出问题的用语,优美但简略;你不满意他的回答,他虽不生气,却让你转人工。对了,接话的是比幼儿园孩子水平还低不少的电话客服机器人,它不能算是AI数字人。在这方面存在两个误区:</p><p class="ql-block"> </p><p class="ql-block">- 误区1:以为“能说话的都是数字人”——错!电话客服机器人只有声音,没有形象,不算数字人;</p><p class="ql-block">​</p><p class="ql-block">- 误区2:以为“有个卡通形象的就是高级数字人”——错!如果只是“有形象,但只会念固定台词,不会识别你的情绪、手势”(比如有些APP里的卡通客服,只会按按钮回复),本质是“加了形象的模板机器人”,不算真正的AI数字人(真正的AI数字人能实时交互,不是念剧本)。</p><p class="ql-block"> </p><p class="ql-block">总之,AI数字人和电话客服机器人的核心边界是「是否有拟人化形象」和「是否有多维度感知交互能力」——电话客服机器人是“单维度语音工具”,AI数字人是“多维度拟人智能体”,前者解决“有没有人应答”,后者解决“应答得像不像真人、体验好不好”。</p>