<p class="ql-block">2025年3月10日,谷歌宣布推出大语言模型杰马的新版杰马3</p> <p class="ql-block">7月5日,谷哥又推出杰马3的新版,Gemma 3n</p> <p class="ql-block">Gemma 3n不取代 Gemma3,而是Gemma3的新成员</p> <p class="ql-block">本文简单介绍Gemma3</p> <p class="ql-block">Gemma3 的一个特点是小型化或轻型化。就像球鞋有不同的尺码一样,Gemma 3 有四个尺码,分别是1B,4B,12B,和27B,或可翻译成10亿个参数,40亿个参数,120亿个参数,和270亿个参数。什么意思呢?可以这样简单地解释,参数量越大,模型的理解能力越强,但体积也跟着膨胀,需要越来越大的运算能力去运行模型。在很多情况下,体量小的模型照样可以做不少事情,却可以在运算能力有限的器件上工作,譬如机器人。</p> <p class="ql-block">另一个特点是个头小,能力强。Gemma3懂得140种语言,内部包含多个模型,不但能够处理文字,而且看得懂图片,视频,听得懂语音和音乐。就处理文字而言,它可以一口气阅读长篇大论,譬如一部中短篇小说。</p> <p class="ql-block">谷歌与英伟达等三家公司合作,优化Gemma 3</p> <p class="ql-block">Gemma 3 仍然在较大的程度上保持开放,可以在多种开源平台上运行或下载。</p> <p class="ql-block">笔者从开源平台 Ollama 上下载 Gemma 3到一台 Windows 电脑上运行。电脑里配置了一个普通的英伟达 GPU 插卡 Nvidia GeForce RTX 4070。插卡是几个月以前买的。</p> <p class="ql-block">在亚马逊上仍然买得到这个型号的插卡,同时,有更新一款的5070供你选择,价格略高。</p> <p class="ql-block">笔者在电脑上做了两个简单的测试,并把 Gemma3 与DeepSeek R1做了比较,在此将测试的过程和结果与各位分享。</p><p class="ql-block">先看一下电脑的硬件配置,这是CPU</p> <p class="ql-block">这是内存 Memory,64G</p> <p class="ql-block">这是英伟达的GPU插卡,卡上内存12G</p> <p class="ql-block">软件配置有三</p><ul><li>Ollama </li><li>Docker Desktop</li><li>Open Web UI</li></ul><p class="ql-block">Open Web UI 是一个 Docker container Web server,提供用户界面</p> <p class="ql-block">三个软件配置均是开源,可免费下载使用。</p><p class="ql-block">这是下载后可供选择运行的开源模型,有好几个。头一个是 Gemma3 27B,最后一个是 DeepSeek R1 32B,两者大小相近,适合比较。</p> <p class="ql-block">测试一为英语语言提问。选择的模型是 Gemma3 27b。问题是 “请评估特朗普第二个任期前六个月的表现”。</p> <p class="ql-block">Gemma 答复分几个段落,从经济和遣返非法移民开始</p> <p class="ql-block">到外交,到国内社会政策</p> <p class="ql-block">再显示模型回答问题时使用的一小段编码</p> <p class="ql-block">然后打分,</p> <p class="ql-block">结束分析。整个应答为时七分钟。</p> <p class="ql-block">运行时,CPU用量大增</p> <p class="ql-block">内存用量接近一半</p> <p class="ql-block">GPU用量不大</p> <p class="ql-block">现在让我们把模型切换到DeepSeek R1 32B</p> <p class="ql-block">问它同样的问题,“请评估特朗普第二个任期前六个月的表现”。</p> <p class="ql-block">它也同样分段回答,谈到经济,移民,外交,和国内社会政策</p> <p class="ql-block">再加上医疗保险和教育</p> <p class="ql-block">结尾时再做一些补充。整个应答为时八分钟。</p> <p class="ql-block">DeepSeek 运行时 CPU 用量不大</p> <p class="ql-block">GPU用量大很多</p> <p class="ql-block">测试二,图片识别。选择 Gemma3,问它 “这是什么?”</p> <p class="ql-block">Gemma 的回答相当详尽,不但辨明那是一个摩托艇,而且说出是什么牌子,什么型号,还说到摩托艇的拖车,甚至拖车上面的商标,令人叹为观止。整个应答为时十七分钟。</p><p class="ql-block">如果带它出去骑那摩托艇玩玩,不知道它还会回答多少花样来呢。</p><p class="ql-block"><a href="https://www.meipian.cn/5dq8ajqj" target="_blank">2025 德州休斯顿清水湖摩托艇游</a></p><p class="ql-block">DeepSeek 尚无能力识别图片。</p> <p class="ql-block">笔者提请各位注意一个有趣的现象,即下载的 Gemma 3 和下载的 DeepSeek R1模型都认为笔者有关特朗普的问题是一个假设的问题,没有 “意识到” 提问时是7月11日,特朗普第二任期的前六个月已经发生。</p> <p class="ql-block">原因应该是用来训练两个模型的数据资料是去年的。如果是这个原因,那么两个模型的线上版不会错。</p> <p class="ql-block">让我们来看 Gemma 3 的线上版 Gemini 双子座。它的回答是对的,没有假设。</p> <p class="ql-block">让我们再来看 DeepSeek 的线上版。它的回答仍然是假设,看来 DeepSeek 的员工们在忙别的活儿,半年多下来,尚未重新训练模型。</p> <p class="ql-block">人工智能是当今科技发展一个奇迹。人工智能以软件实现,但离不开硬件做她的基础。英伟达是全球最大和最先进的人工智能硬件制造商。英伟达的创始人和总裁黄仁勋先生出生台湾,在美国长大,通过几十年艰辛卓著的耕耘和创造,获得巨大的成功。他高度关注中国大陆的发展,英伟达与大陆商业往来密切,几十年从未间断。这个星期他在北京访问。</p> <p class="ql-block">来华之前的7月11日星期五,他专程赴华盛顿与特朗普总统在白宫会面,为改善美中关系而努力。黄仁勋先生是全世界所有华人的骄傲,包括十四亿中国大陆人民。我们期待黄先生访华圆满成功,让美中两国和平竞争,无需压制和反制,从而揭开人工智能发展的新篇章</p> <p class="ql-block">这是谷歌杰马3 产品负责人介绍Gemma 3的视频,有兴趣的朋友不妨看看。</p> <p class="ql-block">2025年7月17日与美国休斯顿</p><p class="ql-block"><a href="https://www.meipian.cn/5dzcx20w" target="_blank">2025 如何组装含有英伟达GPU芯片的简易智能小车JetBot (1)</a></p><p class="ql-block"><a href="https://www.meipian.cn/5cxyldnq" target="_blank">2025 英伟达技术浅谈 - 计算统一设备架构 (CUDA)</a></p><p class="ql-block"><a href="https://www.meipian.cn/5cid7hxu" target="_blank">2025 英伟达芯片出口限制</a></p><p class="ql-block"><br></p>