智能始于记忆20251205

晨清

重构智能体认知底座，开启记忆原生 AI 时代 围绕“AI 记忆”这一核心命题，深入探讨如何通过系统级创新，解决大模型在走向智能体（Agent）时代的“金鱼记忆”、高成本与高幻觉等痛点，并正式推出了 MemOS 云平台与 MindDock 个人记忆助手，开启了从“Token 推理”迈向“记忆推理”的新范式。记忆是 AI 进化的生命内核随着 Agent 市场预计在 2028 年达到 3.3 万亿规模，“记忆能力”已成为模型继续进化的核心要素。世界在加速变化，而静态模型却在迅速“老化”。单纯堆砌超长上下文（Long Context）不仅带来成本爆炸，更会导致关键信息的稀释与遗忘。因此，记忆需要一套系统级的主动管理和调度机制，而这正是 MemOS 作为操作系统的核心价值所在。从“检索模块”到“记忆操作系统”MemOS 定义自己为“记忆操作系统（Memory OS）”，而非传统的“记忆模块”或“向量检索库”。他指出，这种“反常识”恰恰击中了过去一段时间智能体开发的真正痛点。MemOS 不是简单的向量库外挂，而是业内首个操作系统级别的记忆增强框架。它将大模型的认知结构划分为参数记忆、激活记忆、明文记忆三层，通过自研的 Agentic 自动编排框架与记忆原生模型，实现了记忆的全生命周期管理。MemOS 赋予了 AI “低幻觉、个性化、持续学习”的能力，让 Agent 从“单轮问答工具”进化为“具备长期认知的智能伙伴”。“MemOS 让记忆成为 AI 底层运行的能力，从模型到系统、从算子到硬件实现真正的长期智能。” MemOS 云平台：让记忆能力开箱即用MemOS 云平台是业界首个面向大规模 AI 应用的云端记忆服务，凭借其卓越的性能和成本控制力，为企业、开发者提供了随时可用的记忆能力。在性能层面，MemOS 云平台依托商汤大装置与算丰信息的硬件级保障，完美适配 PD 分离架构，实测可达到 100 QPS 高并发下 100% 成功率，写入与检索延迟均低于 500ms，完全满足实时游戏、在线客服等严苛场景的 SLA 要求。为了打造更开放的记忆生态，记忆张量现场宣布正式发布 “开发者扶持计划”，全球开发者现可免费申请 MemOS 云平台服务的使用额度与技术支持，助力加速创新落地。 MemOS 不仅全面支持 API、MCP，还已上架魔搭、Coze、Dify 等主流 MCP 插件市场，支持私有化部署，覆盖从个人开发者到大型企业的全场景需求。MindDock：你的专属外置大脑如果说 MemOS 云平台是企业、开发者的记忆中枢，那么 MindDock 则是面向 C 端用户的专属“个人记忆助手”，代表着记忆张量对 C 端用户长期陪伴价值的承诺。作为业界首个跨平台记忆迁移工具，MindDock 解决了用户被单一模型锁定的痛点，它支持在包括 ChatGPT、千问等主流 AI 平台间无缝迁移用户的长期记忆。通过无感记忆注入技术，MindDock 能够自动沉淀并结构化用户的偏好、背景与工作流，使得 AI 能够“即刻懂你”，无需重复对话。MindDock 的愿景是打造一个终身伴随的数字孪生记忆库，让用户的记忆资产贯穿于所见、所听、所思之间，真正实现 AI 助手的“越用越聪明”。现在 MindDock 已正式上架 Google 应用商店，欢迎下载体验试用。生态共振：多行业落地实践MemOS 的价值不仅停留在技术层面，更在底层算力、游戏开发、金融科技、C 端陪伴等垂直领域实现了深度落地，与生态伙伴共同构建了记忆驱动的应用新范式。国产算力突破：商汤 × MemOS“国产 GPU 高性能推理突破”，深入剖析了合作的技术内核——PD 分离架构。Prefill 阶段是“理解”，Decode 阶段是“回答”。针对两类任务对算力与带宽截然不同的需求，设计了 4P8D（4 台 Prefill 节点 + 8 台 Decode 节点）的硬件拓扑，彻底消除了资源争抢。P 节点作为专属“记忆工厂”，专门负责 MemOS“影子 Prompt”的预计算与 KV Cache 批量生成；而 D 节点则通过分片加载专家（MoE）策略，释放显存以承载更大并发，专注于实时交互。这一架构让集群吞吐量提升 75%，单卡并发效率提升 20%，时延降低 30%。更重要的是，在严格的 SLA 约束下，它证明了国产算力不仅能用，更能通过软硬协同实现 150% 的性价比超越。虚拟陪伴进化：筑梦岛 × MemOS筑梦岛 App 从产品运营视角，探讨了“记忆之于虚拟陪伴”的决定性作用。筑梦岛的高粘性用户（月活 > 20 天）日均输入字数超 4000 字，这构成了海量的记忆处理需求。女性用户对陪伴感的要求分为三层：像真人（连贯性）、有男友感（独特性）、有惊喜感（主动性）。针对传统“每 X 轮总结一次”导致的语义丢失和“超忆症”（事无巨细全记）带来的体验下降，筑梦岛正与 MemOS 探索基于场景和语义切分的记忆存储。通过对记忆进行分类（人设/喜好/细节）与提权降噪，实现“该记的刻骨铭心，该忘的过眼云烟”，从而支撑起跨越聊天、约会、朋友圈等多场景的沉浸式恋爱体验。游戏开发革新：Unity × MemOSUnity 中国技术经理范乃如先生展示了“Vibe Coding × 记忆系统”。3A 游戏项目包含百万行代码与上万资产，传统 AI 助手往往“看懂代码却找不到上下文”。MemOS 帮助 Codely 记住了跨越数年的开发周期中的关键决策，解决了多模态割裂（代码、材质、物理参数）与长期迭代一致性的问题。金融数智升级：工商银行 × MemOS“智能体记忆赋能金融业务”的深度复盘。在金融这种强调服务连续性的行业，记忆是避免服务断层的关键。在智能会议纪要场景，通过“分层实时摘要”技术，解决了 4 小时超长会议的信息遗忘问题；在数据洞察场景，通过提取“关键要素”，将单次对话支持的轮数从 3 轮提升至 20 轮，准确率提升 5%。学术与开源：共建记忆科学新未来，通过顶尖学者的视角，指明了记忆技术的未来演进方向。开源生态：OpenMem 全球社区OpenMem 社区的最新进展。他强调，记忆工程是一个复杂系统，不仅需要技术，更需要生态。OpenMem 社区致力于打通政产学研用，成为记忆资源与标准的制定者。社区围绕多模态记忆、具身记忆、记忆幻觉消除等前沿课题展开了全面协作。目前，OpenMem 社区网站已正式上线，大家可以通过网站查阅最新研究进展。社区在短短半年内的成果，并呼吁更多开发者加入，共同探索从“被动式交互”向“主动式用户建模”的转变，让记忆不仅仅是存储，更是价值判断与决策的基础。学术前沿：大模型的可塑性通过“大模型的可塑性”相关研究，现有的符号化记忆系统面临信息冗余、冲突以及“不知道什么时候该记”的难题。受人脑启发提出的 LightMem 架构，引入了信息熵预压缩模块，能过滤掉约 50% 的冗余信息；并通过无监督的主题分割，将语义相关的记忆紧凑存储，避免“数学和音乐记忆打架”。LightMem 采用了创新的“离线睡眠更新”机制。在 Agent 与用户交互时暂不更新记忆库，待空闲（睡眠）时再进行批量的重组、去重与抽象。这种非侵入式的更新方式，在保证记忆高保真的同时，显著降低了计算开销。框架实践：魔搭社区 x MemOS魔搭社区技术，已正式上架至魔搭 MCP 广场，提供托管云服务与私有化部署选项。未来的记忆系统将向“多模态统一表征、自适应分层、自我进化”的方向演进，甚至可能出现不依赖 Web 系统的原生大模型检索（Native Agentic Search）。以 Doc Research（深度文档研究）为例，展示了如何通过分层文档抽取和多模态上下文管理，解决异构信息整合的难题；并介绍了 Agent Skills 协议，通过文件派生方式保存记忆，实现技能的渐进式加载。Agentic AI 的记忆标准围绕“记忆 × Agentic AI”展开的深度对话达成共识：记忆正在从“体验功能”上升为“战略入口”。未来的智能体竞争，将是“记忆质量”与“认知深度”的竞争。MemOS 所倡导的“记忆分层、结构化存储、主动调度”理念，正在成为定义下一代智能体生态的关键标准。结语从底层算力到上层应用，从学术理论到开源社区，本次发布会展示了 MemOS 构建“记忆原生 AI 生态”的完整蓝图。记忆张量将继续携手合作伙伴，推动 AI 从“计算”走向“认知”，让每一个智能体都拥有可成长、可信赖的长期记忆，共同迎接可持续智能的未来！关于 MemOSMemOS 为 AGI 构建统一的记忆管理平台，让智能系统如大脑般拥有灵活、可迁移、可共享的长期记忆和即时记忆。作为记忆张量首次提出“记忆调度”架构的 AI 记忆操作系统，我们希望通过 MemOS 全面重构模型记忆资源的生命周期管理，为智能系统提供高效且灵活的记忆管理能力。