<p class="ql-block">AI语音识别上的新发展,是一次人类文明意义上的突破!现在,人与宠物、人与野生动物、大人和刚出生婴儿,可以交流了。</p><p class="ql-block"><br></p><p class="ql-block">仿佛童话世界里,AI能帮你跟宠物狗对话,你走在公园能听懂路边鸟叫,妈妈能知道宝宝哭是饿了还是因为疼?</p><p class="ql-block">高度内卷的现代生活,让人们厌倦了与人打交道,还有那些精神疾病患者,低能者,失语者失意者,想躲又躲不开精神内耗的人群,有了倾诉对象和交流新世界。</p><p class="ql-block">在外面卷不动就回家招猫逗狗,去公园呼鼠唤鸟。这对建设社会和谐有巨大的贡献。</p><p class="ql-block"><br></p><p class="ql-block">动物真的有语言吗?当鸟在叽叽喳喳、狗汪汪汪叫的时候,它们是在用随机的叫声抒发情绪吗?每种动物的语言是统一的吗?它们有外语和方言吗?</p><p class="ql-block">现在有了AI,机器学习做出了突破性的成果。</p><p class="ql-block">硅谷有位连续创业者叫孙邻家搞了一款能在宠物语言和人的语言之间互相翻译的手机应用,叫 Traini。</p><p class="ql-block">你家小狗对你汪汪叫,你用手机接收一下它的叫声,还能结合表情图像,traini 就会翻译成人的语言!你对着APP说一句指令,手机会把它翻译成汪汪汪,然后狗狗真听懂了!</p><p class="ql-block">我们普通人是听不出来每一句汪汪汪有多大区别的,但AI可以分别。孙邻家的公司专门训练了一个狗狗叫声识别AI模型,叫 PetGPT,现在识别准确率达到了81.5%。他们已经把模型用在多个场景和不同硬件上,比如让机器狗和宠物狗直接对话。</p><p class="ql-block">人和黑猩猩的语言有个本质区别。人的语言很大程度上是个文化现象,每个族群、每个地区都有自己的语言,需要后天学习才行;而黑猩猩的语言则是一个反射性的情绪表达系统,是一种本能的“叫声”,不需要学习,同一种黑猩猩的叫声是一样的。你不需要专门对比黑龙江哈尔滨的狗狗和海南三亚的狗狗分别训练,它们只要是同一个品种,叫声和表情就不会差太多。</p><p class="ql-block">当然既然是叫声,就不能传达特别复杂的意思,你不能指望狗狗跟你聊马克思主义学院新时代思政,但是能把那些动物性的意思都准确识别,就已经很有用了。狗狗对你叫,它到底是饿了,还是想出去玩呢?以前全靠猜,现在AI帮它翻译。</p><p class="ql-block">人类一直都在养狗,怎么以前就没有专门识别狗狗叫声的应用,甚至连这门学问都没有呢?因为没有办法数据化。人类的文字无法精确描述狗的叫声。你必须使用数学方法把声音变成各种波形,也就是可视化,再用机器学习方法自动提取其中的成千上万个特征,才谈得上去识别。</p><p class="ql-block"><br></p><p class="ql-block">现在基础设施齐备,用上AI,动物学家正在大干一场。《纽约人》杂志刚出了一篇报道,讲了科学家在破解鸟叫声方面的进展。</p><p class="ql-block"><br></p><p class="ql-block">灰燕是一种候鸟,每年成群地长途迁徙,它们有复杂的社会关系而且实行一夫一妻制。灰燕有至少十种不同的叫声。离开一个地方的时候会叫一下,到达一个地方会叫一下,发出联系信号,它们能通过叫声知道盟友在什么地方。</p><p class="ql-block">西伯利亚松鸦会用至少三种不同的叫声向同伴报警:一种表示附近有老鹰正在盘旋;一种是说鹰已经飞过来了;第三种代表鹰正在主动攻击。</p><p class="ql-block">鸟叫声有一定的通用性。比如看见猫头鹰来了,山雀会发出响亮的“啾啾啾”叫声报警,危险程度越高“啾”的次数越多,而附近的五子雀能听懂山雀这个叫声,而且还会加入进来,跟山雀形成防御联盟去围攻猫头鹰。</p><p class="ql-block">杜鹃这种鸟有个很坏的行为,就是把自己的蛋下到别的鸟的巢中,被人家当亲生的养。然后孵出的小杜鹃还会把养父母的子女给杀死!其他鸟类知道杜鹃有这个恶习。当杜鹃出现的时候,周围的鸟就会发出警报!把澳大利亚的鸟对杜鹃的警报声拿到中国播放,中国的鸟也都能听懂。</p><p class="ql-block">鸟甚至有语法。比如一只鸟唱了一首歌,发音顺序用ABC代表。研究者把录音中的顺序稍微变一下,成为CBA,这大约相当于是从“我爱你”变成“你爱我”,对人的语言来说顺序一变意思就变了,研究结果发现对鸟也是如此。山雀听到这两句话后的行为有很大不同。一旦破译了鸟的叫声,科学家就发现鸟有很高的智能。有的鸟甚至还会说谎,比如发出假警报。</p><p class="ql-block">破译工作现在还很初级,主要都是一些警报之类的简单信号。但是鸟很可能有复杂的语言。一群鸟聚在一起叽叽喳喳地聊天,它们在聊什么?科学家们正在研究。</p><p class="ql-block">宠物试图跟人交流、野生鸟叫、婴儿试图传达自己的状态,那些信号早就存在,自古以来就存在,我们以前一直无视它们。学者直到不久前还在对“鸟有没有语言”这个问题争论不休,一般人更是直接把那些信息视为杂乱无章的噪声。</p><p class="ql-block">不是因为我们太粗心,而是因为我们没有好的工具和手段分析它们。一百年前一个喜欢观察鸟的动物学家,再怎么也想不到今天我们居然可以精确破解那些信息。</p><p class="ql-block">而那些信息明明就在眼前。AI技术等于是帮我们打开了世界的一个新层面。</p><p class="ql-block">试想几年后,你戴个增强现实眼镜出去走一走,你会听懂小区里的鸟在说什么,你甚至可能知道每一只鸟的名字和个性;你直接跟邻居家的狗狗对话;更不用说你会非常理解小婴儿的状态和需求。</p><p class="ql-block">那么人与人之间、人与宠物、人与野生动物之间的联系将会上升到一个什么样的境界。</p><p class="ql-block">我们再想想,生活中还有没有别的信息,就在眼前而我们不知道如何解读呢?</p><p class="ql-block">比如说气味。我们能不能用手机一“闻”就知道这家餐馆的食材够不够新鲜,甚至知道菜是从哪买的,牛肉是哪天的?</p><p class="ql-block">再比如情绪。《微表情》学虽然现在还不怎么靠谱,但如果我们能够方便测量一个人的皮肤温度和心率变化,能不能更好地解读对方的情绪呢?他是不是太紧张了?我一出这张牌他为啥显得有点害怕呢?</p><p class="ql-block">还有环境中的微小颗粒。也许植物身上有这个地方的现场信息,能说明过去一星期中这里的环境好不好。也许看一眼桌子上的灰尘就知道这里曾经发生过什么活动……</p><p class="ql-block">人可以在AI的帮助下变得非常敏锐。随便找个地方跟鸟吵吵架,跟狗拉拉瓜就够你欢乐一辈子的。</p><p class="ql-block">世界如此丰富多彩,还卷个什么劲儿呢?</p> <p class="ql-block">陈凉,资深科普作家,影视科学家,爱国文化导演,雷锋理论研究学者。</p><p class="ql-block"> 陈凉科技影视技术流创始人,其保持流动的拍摄手法与高效精准的摄录制播独树一帜,源于平衡车加稳定器摄影的有机组合。</p><p class="ql-block"> 陈凉科技是中国国内研究平衡车摄影的早期领航者,也是少有的具有工程学思维的影视导演。</p>