大数据与人工智能|大模型在现有法律框架下全生命周期的合规性处理

深视野

<p class="ql-block" style="text-align:center;"><b>大数据与人工智能|大模型在现有法律框架下全生命周期的合规性处理</b></p><p class="ql-block" style="text-align:center;"><br></p><p class="ql-block" style="text-align:center;"><br></p><p class="ql-block" style="text-align:center;"><br></p><p class="ql-block" style="text-align:center;"><br></p><p class="ql-block" style="text-align:center;"><br></p><p class="ql-block" style="text-align:center;"><b>写于2025年10月11日飞桂林途中</b></p><p class="ql-block"><br></p><p class="ql-block"><br></p><p class="ql-block"><br></p><p class="ql-block"><br></p><p class="ql-block ql-indent-1">在之前的文章中简略探讨了就“数据为王”的未来经济形态以数据为对象的直接税征税模式<a href="https://mp.weixin.qq.com/s/TtiSvZqHQrHogjYC3nyF0w" target="_blank" style="font-size:18px; background-color:rgb(255, 255, 255);">大数据与人工智能|数智时代的数据共享机制与保护</a>,以及全类数据确权的底层结构路径与立法技术解决方案<a href="https://mp.weixin.qq.com/s/FjT6BFPUd7zFcWqHQQ5LXg" target="_blank" style="background-color:rgb(255, 255, 255); font-size:18px;">大数据与人工智能|数据确权的底层结构路径及技术解决方案</a>,如今随着大数据与人工智能的高度融聚发展,尤其是生成式人工智能的高速发展,全面、系统、整体、深度立法予以规制显然不现实,毕竟立法总是滞后的,尤其对于新事物、新现象而言;但相应出台各类行业性规定、规范性文件等,还是可以实现的。</p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1">就当前而言,我国在原有的算法推荐监管基础上,即以《互联网信息服务算法推荐管理规定》为中心的算法配套管理规定下,考虑到大模型自身及其发展方式的特殊性,又相继出台了《生成式人工智能服务管理暂行办法》,由此形成了“算法+服务”的规范化、体系化、制度化运行的数智发展法律基本框架。</p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1">就该法律框架下,算法提供者、生成式人工智能服务提供者如何进行“算法”备案与“服务”备案,或其“双备案”,进行简要的分析并整理。</p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><b>一、两种备案模式的关注点与监管要义</b></p><p class="ql-block ql-indent-1">基于大模型需要大规模的数据训练,要比大语言模型仅基于文本训练所需的全类数据更为庞大,而数据来源又涉及不同主体,其使用与生成不仅关涉数据安全、隐私安全,还涉及算法伦理、算法歧视、服务歧视等层面的问题。</p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1">大模型的算法备案,一方面要做到算法透明与算法公平等基础监管要求,同时也需要依据其生成内容方面,如图像、视频、语音/音频、多模态、代码等,因有可能侵犯他人隐私,或者存在危害公共安全、国家安全等风险,还需要依据《生成式人工智能服务管理暂行办法》进行必要的服务备案。</p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1">一般而言,仅就算法支持的技术本身来说,应当依据《互联网信息服务算法推荐管理规定》做算法备案;就其具体提供生成式内容服务而言(如前面提到的生成图像、视频、文本等),则应当进行服务备案。</p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><b>二、备案的主要法律要求</b></p><p class="ql-block ql-indent-1"><b>1、安全性方面;</b>向各类主体提供生成式人工智能相应服务的首要前提,就是要全面、系统评估其安全性,这方面都有相应的国家规定。主要集中在:</p><p class="ql-block ql-indent-1"><b>(1)数据合规</b>,即所使用的训练数据来源符合当前法律要求,特别是对于核心训练数据而言。涉及个人信息时,应当同时符合《中华人民共和国个人信息保护法》的要求。此外,整体上还应进行相应的、必要的数据标注;</p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><b>(2)内容合规</b>,即无涉恐怖主义、反人类暴行或其他血腥暴力类型,以及其他违反宪法法律的内容。而且,还要具备一定的内容过滤能力,有相应技术措施避免生成非法有害信息。比如,我们公众熟知的各类平台的关键词智能过滤机制、人工复审流程、模型内置的价值观对齐等;</p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><b>(3)算法合规</b>,即没有算法伦理问题,比如算法歧视等。以上贯穿始终的还应当确保公共安全、国家安全,而且如安全评估不过关,则便不具备后续备案的初始资格。</p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><b>2、两种备案的侧重点</b>;算法备案主要集中在整体架构及其设计、训练数据规模与类型、优化目标及其实现、生成的基础原理等详细说明上。向各类主体提供生成式人工智能服务时的服务备案则主要是需公示具体所提供的服务名称、服务规模、服务类型、服务受众、免责声明等内容。</p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><b>三、备案主体</b></p><p class="ql-block ql-indent-1">需要进行前述备案的主体,指在中国境内向社会公众、企业/事业单位、个人等提供生成式人工智能服务的各类组织和个人,无论提供服务的是何种通道,比如自营App,或利用API接口,又或提供软件服务的SaaS平台,皆需进行相应的备案,以便监管。</p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><b>四、备案策略</b></p><p class="ql-block ql-indent-1"><b>1、备案要素前置;</b>在进行生成式人工智能研发的过程中就对所使用的各类数据严格要求,确保数据收集合法,且全部可追溯,并在必要时进行相应的数据清洗,同时注重数据标注的监管要求,全面构筑数据资产合规护城河,并做好各类登记台账以备查。在大模型的架构及其设计过程中,确保算法公平、可合理解释、内容及其生成防范有害信息的安全机制,如此在源头进行“数据治理”,将为后续的安全性评估、备案等铺平道路。</p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><b>2、备案材料简明、详略得当且逻辑清晰;</b>就安全性而言,应着重用数据、案例和响应流程来证明安全措施的有效性,比如关键词智能过滤测试报告、内置价值观对齐测试报告、防范有害信息生成测试报告,以及受到攻击时的有害攻击识别及其拦截成功概率等测试报告。同时,还应就算法进行精准精准的说明,既简明扼要,又易于为一般技术人员所理解及接受。</p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1">大模型备案在全面落地执行过程中,随着其算法、技术迭代的飞速发展,还会遇到各种各样的、甚至前所未有的新问题,尤其对于备案主体来讲这又涉及不断“变更备案”的现实需求,就此海淀区律师协会专门成立的“大数据与人工智能”专家库可提供专家咨询服务、全生命周期法律指导服务等。</p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1"><br></p><p class="ql-block"><br></p>