<p class="ql-block">中国AI再放大招!这回,轮到美国来追了!</p><p class="ql-block"> </p><p class="ql-block">家人们!今天这个消息,绝对要炸翻整个AI圈!</p><p class="ql-block"> </p><p class="ql-block">就在刚刚,咱们国内的创业公司深度求索,正式推出并且开源了他们的全新大模型——DeepSeek-R1!而且啊,这个模型在数学、代码、自然语言推理这些核心任务上,已经能比肩OpenAI的O1正式版了!</p><p class="ql-block"> </p><p class="ql-block">这一下,直接引爆了整个AI领域,连国际上的AI大佬们都坐不住了,纷纷转发点赞!</p><p class="ql-block"> </p><p class="ql-block">AUTOML的作者Kasper Hansen就说:“真的很难相信,如此强大的模型,背后的逻辑竟然可能这么简单!” 因为它的预训练,直接采用了强化学习的路线,完全没走监督微调的老路!</p><p class="ql-block"> </p><p class="ql-block">更让人振奋的是,UC Berkeley的教授Alex Decks甚至直接表态:“DeepSeek现在已经处于领先位置了!现在,是时候让美国的公司来迎头赶上了!”</p><p class="ql-block"> </p><p class="ql-block">家人们,听到了吗?“轮到美国公司来追赶了!” 这是什么样的底气和实力!</p><p class="ql-block"> </p><p class="ql-block">这次深度求索一口气发布了两个大模型:参数高达6600亿的DeepSeek-R1和DeepSeek-A2,并且完全开源了模型权重!这意味着,任何用户都可以用它们来训练自己的模型,这波操作,直接把技术的门槛给拉低了,让更多人能参与到AI的创新中来!</p><p class="ql-block"> </p><p class="ql-block">不仅如此,DeepSeek还做了一件特别贴心的事——他们把大模型蒸馏成了六个小模型,而且这六个小模型,同样完全开源!</p><p class="ql-block"> </p><p class="ql-block">性能上,这波蒸馏后的模型更是惊艳!比如R1-32B和70B版本,性能直接逼近OpenAI的O1-mini,远超DeepSeek-V4、Claude 3.5 Sonnet还有Q-32B这些主流模型!</p><p class="ql-block"> </p><p class="ql-block">而价格呢?它更是绝对的王者!目前DeepSeek-R1的API服务定价,每百万输入tokens只要0.14美元!对比一下OpenAI的O1,每百万输入tokens要15美元!这简直就是白菜价啊家人们!</p><p class="ql-block"> </p><p class="ql-block">更有意思的是什么?在深度求索的很多论文里,DeepSeek AI竟然是作者列表的第一位!这不仅是技术的突破,更是AI自主科研能力的一次完美展示!</p><p class="ql-block"> </p><p class="ql-block">回想过去,我们总是在说,中国AI在追赶国际先进水平。但今天,DeepSeek用实力告诉全世界:</p><p class="ql-block"> </p><p class="ql-block">这回,终于轮到美国AI来追赶中国AI了!</p><p class="ql-block"> </p><p class="ql-block">这不仅是一家中国创业公司的胜利,更是中国AI技术在全球舞台上的一次重磅发声!让我们一起期待,深度求索能带来更多惊喜,也期待中国AI能在未来,创造更多的第一!</p>