<p class="ql-block">重构智能体认知底座,开启记忆原生 AI 时代</p><p class="ql-block"><br></p><p class="ql-block">围绕“AI 记忆”这一核心命题,深入探讨如何通过系统级创新,解决大模型在走向智能体(Agent)时代的“金鱼记忆”、高成本与高幻觉等痛点,并正式推出了 MemOS 云平台与 MindDock 个人记忆助手,开启了从“Token 推理”迈向“记忆推理”的新范式。</p><p class="ql-block">记忆是 AI 进化的生命内核</p><p class="ql-block">随着 Agent 市场预计在 2028 年达到 3.3 万亿规模,“记忆能力”已成为模型继续进化的核心要素。</p><p class="ql-block">世界在加速变化,而静态模型却在迅速“老化”。单纯堆砌超长上下文(Long Context)不仅带来成本爆炸,更会导致关键信息的稀释与遗忘 。因此,记忆需要一套系统级的主动管理和调度机制,而这正是 MemOS 作为操作系统的核心价值所在。</p><p class="ql-block">从“检索模块”到“记忆操作系统”</p><p class="ql-block">MemOS 定义自己为“记忆操作系统(Memory OS)”,而非传统的“记忆模块”或“向量检索库”。他指出,这种“反常识”恰恰击中了过去一段时间智能体开发的真正痛点。</p><p class="ql-block">MemOS 不是简单的向量库外挂,而是业内首个操作系统级别的记忆增强框架。它将大模型的认知结构划分为参数记忆、激活记忆、明文记忆三层,通过自研的 Agentic 自动编排框架与记忆原生模型,实现了记忆的全生命周期管理 。</p><p class="ql-block">MemOS 赋予了 AI “低幻觉、个性化、持续学习”的能力,让 Agent 从“单轮问答工具”进化为“具备长期认知的智能伙伴”。</p><p class="ql-block">“MemOS 让记忆成为 AI 底层运行的能力,从模型到系统、从算子到硬件实现真正的长期智能。” </p><p class="ql-block"><br></p><p class="ql-block">MemOS 云平台:让记忆能力开箱即用</p><p class="ql-block">MemOS 云平台是业界首个面向大规模 AI 应用的云端记忆服务,凭借其卓越的性能和成本控制力,为企业、开发者提供了随时可用的记忆能力。</p><p class="ql-block">在性能层面,MemOS 云平台依托商汤大装置与算丰信息的硬件级保障,完美适配 PD 分离架构,实测可达到 100 QPS 高并发下 100% 成功率,写入与检索延迟均低于 500ms,完全满足实时游戏、在线客服等严苛场景的 SLA 要求。</p><p class="ql-block">为了打造更开放的记忆生态,记忆张量现场宣布正式发布 “开发者扶持计划”,全球开发者现可免费申请 MemOS 云平台服务的使用额度与技术支持,助力加速创新落地。</p><p class="ql-block"> MemOS 不仅全面支持 API、MCP,还已上架魔搭、Coze、Dify 等主流 MCP 插件市场,支持私有化部署,覆盖从个人开发者到大型企业的全场景需求。</p><p class="ql-block">MindDock:你的专属外置大脑</p><p class="ql-block">如果说 MemOS 云平台是企业、开发者的记忆中枢,那么 MindDock 则是面向 C 端用户的专属“个人记忆助手”,代表着记忆张量对 C 端用户长期陪伴价值的承诺。</p><p class="ql-block">作为业界首个跨平台记忆迁移工具,MindDock 解决了用户被单一模型锁定的痛点,它支持在包括 ChatGPT、千问等主流 AI 平台间无缝迁移用户的长期记忆。通过无感记忆注入技术,MindDock 能够自动沉淀并结构化用户的偏好、背景与工作流,使得 AI 能够“即刻懂你”,无需重复对话。</p><p class="ql-block">MindDock 的愿景是打造一个终身伴随的数字孪生记忆库,让用户的记忆资产贯穿于所见、所听、所思之间,真正实现 AI 助手的“越用越聪明”。现在 MindDock 已正式上架 Google 应用商店,欢迎下载体验试用。</p><p class="ql-block">生态共振:多行业落地实践</p><p class="ql-block">MemOS 的价值不仅停留在技术层面,更在底层算力、游戏开发、金融科技、C 端陪伴等垂直领域实现了深度落地,与生态伙伴共同构建了记忆驱动的应用新范式。</p><p class="ql-block">国产算力突破:商汤 × MemOS</p><p class="ql-block">“国产 GPU 高性能推理突破”,深入剖析了合作的技术内核——PD 分离架构。</p><p class="ql-block">Prefill 阶段是“理解”,Decode 阶段是“回答”。针对两类任务对算力与带宽截然不同的需求,设计了 4P8D(4 台 Prefill 节点 + 8 台 Decode 节点) 的硬件拓扑,彻底消除了资源争抢。P 节点作为专属“记忆工厂”,专门负责 MemOS“影子 Prompt”的预计算与 KV Cache 批量生成;而 D 节点则通过分片加载专家(MoE)策略,释放显存以承载更大并发,专注于实时交互。</p><p class="ql-block">这一架构让集群吞吐量提升 75%,单卡并发效率提升 20%,时延降低 30%。更重要的是,在严格的 SLA 约束下,它证明了国产算力不仅能用,更能通过软硬协同实现 150% 的性价比超越。</p><p class="ql-block">虚拟陪伴进化:筑梦岛 × MemOS</p><p class="ql-block">筑梦岛 App 从产品运营视角,探讨了“记忆之于虚拟陪伴”的决定性作用。筑梦岛的高粘性用户(月活 > 20 天)日均输入字数超 4000 字,这构成了海量的记忆处理需求。女性用户对陪伴感的要求分为三层:<b>像真人(连贯性)、有男友感(独特性)、有惊喜感(主动性)</b>。</p><p class="ql-block">针对传统“每 X 轮总结一次”导致的语义丢失和“超忆症”(事无巨细全记)带来的体验下降,筑梦岛正与 MemOS 探索基于场景和语义切分的记忆存储。通过对记忆进行分类(人设/喜好/细节)与提权降噪,实现“该记的刻骨铭心,该忘的过眼云烟”,从而支撑起跨越聊天、约会、朋友圈等多场景的沉浸式恋爱体验 。</p><p class="ql-block">游戏开发革新:Unity × MemOS</p><p class="ql-block">Unity 中国技术经理范乃如先生展示了“Vibe Coding × 记忆系统”。3A 游戏项目包含百万行代码与上万资产,传统 AI 助手往往“看懂代码却找不到上下文”。MemOS 帮助 Codely 记住了跨越数年的开发周期中的关键决策,解决了多模态割裂(代码、材质、物理参数)与长期迭代一致性的问题。</p><p class="ql-block">金融数智升级:工商银行 × MemOS</p><p class="ql-block">“智能体记忆赋能金融业务”的深度复盘。在金融这种强调服务连续性的行业,记忆是避免服务断层的关键。</p><p class="ql-block">在智能会议纪要场景,通过“分层实时摘要”技术,解决了 4 小时超长会议的信息遗忘问题;在数据洞察场景,通过提取“关键要素”,将单次对话支持的轮数从 3 轮提升至 20 轮,准确率提升 5%。</p><p class="ql-block">学术与开源:共建记忆科学新未来,通过顶尖学者的视角,指明了记忆技术的未来演进方向。</p><p class="ql-block">开源生态:OpenMem 全球社区</p><p class="ql-block">OpenMem 社区的最新进展。他强调,记忆工程是一个复杂系统,不仅需要技术,更需要生态。</p><p class="ql-block">OpenMem 社区致力于打通政产学研用,成为记忆资源与标准的制定者。社区围绕多模态记忆、具身记忆、记忆幻觉消除等前沿课题展开了全面协作。目前,OpenMem 社区网站已正式上线,大家可以通过网站查阅最新研究进展。</p><p class="ql-block">社区在短短半年内的成果,并呼吁更多开发者加入,共同探索从“被动式交互”向“主动式用户建模”的转变,让记忆不仅仅是存储,更是价值判断与决策的基础。</p><p class="ql-block">学术前沿:大模型的可塑性</p><p class="ql-block">通过“大模型的可塑性”相关研究,现有的符号化记忆系统面临信息冗余、冲突以及“不知道什么时候该记”的难题。</p><p class="ql-block">受人脑启发提出的 LightMem 架构,引入了信息熵预压缩模块,能过滤掉约 50% 的冗余信息;并通过无监督的主题分割,将语义相关的记忆紧凑存储,避免“数学和音乐记忆打架”。LightMem 采用了创新的“离线睡眠更新”机制。在 Agent 与用户交互时暂不更新记忆库,待空闲(睡眠)时再进行批量的重组、去重与抽象。这种非侵入式的更新方式,在保证记忆高保真的同时,显著降低了计算开销。</p><p class="ql-block">框架实践:魔搭社区 x MemOS</p><p class="ql-block">魔搭社区技术,已正式上架至 魔搭 MCP 广场,提供托管云服务与私有化部署选项。</p><p class="ql-block">未来的记忆系统将向“多模态统一表征、自适应分层、自我进化”的方向演进,甚至可能出现不依赖 Web 系统的原生大模型检索(Native Agentic Search)。</p><p class="ql-block">以 Doc Research(深度文档研究) 为例,展示了如何通过分层文档抽取和多模态上下文管理,解决异构信息整合的难题;并介绍了 Agent Skills 协议,通过文件派生方式保存记忆,实现技能的渐进式加载。</p><p class="ql-block">Agentic AI 的记忆标准</p><p class="ql-block">围绕“记忆 × Agentic AI”展开的深度对话达成共识:记忆正在从“体验功能”上升为“战略入口”。未来的智能体竞争,将是“记忆质量”与“认知深度”的竞争。MemOS 所倡导的“记忆分层、结构化存储、主动调度”理念,正在成为定义下一代智能体生态的关键标准。</p><p class="ql-block">结语</p><p class="ql-block">从底层算力到上层应用,从学术理论到开源社区,本次发布会展示了 MemOS 构建“记忆原生 AI 生态”的完整蓝图。</p><p class="ql-block">记忆张量将继续携手合作伙伴,推动 AI 从“计算”走向“认知”,让每一个智能体都拥有可成长、可信赖的长期记忆,共同迎接可持续智能的未来!</p><p class="ql-block">关于 MemOS</p><p class="ql-block">MemOS 为 AGI 构建统一的记忆管理平台,让智能系统如大脑般拥有灵活、可迁移、可共享的长期记忆和即时记忆。</p><p class="ql-block">作为记忆张量首次提出“记忆调度”架构的 AI 记忆操作系统,我们希望通过 MemOS 全面重构模型记忆资源的生命周期管理,为智能系统提供高效且灵活的记忆管理能力。</p>