Privacy Considerations for LLMs and Other AI Models (Frontiers in Communications and Networks, 2025)
核心问题与动机
论文的核心问题在于:当前 AI 系统(特别是大型语言模型 LLM)缺乏一个系统性、易于理解的隐私保护框架,导致隐私保护措施常出现误判与不当实施。传统资料系统已有成熟的隐私治理框架(如 DAMA DMBOK),但 AI 系统因训练、部署与推论流程的特殊性,隐私风险更复杂且跨领域,容易造成开发者、部署者与隐私专业人员的认知落差。
主要动机包括:
- 桥接资料隐私与 AI 领域:将资料专业人士熟悉的「输入隐私(Input Privacy)」与「输出隐私(Output Privacy)」框架应用到 AI 系统,建立平行对照,促进跨领域沟通。
- 解决实务痛点:AI 训练常需大量资料,雲端部署、持续学习(user prompts)、RAG(Retrieval Augmented Generation)等情境增加隐私外泄风险;同时,模型记忆效应(memorization)可能导致训练资料外泄。
- 实务导向:帮助开发者与部署者在系统设计阶段即考量隐私(Privacy by Design),降低误用 PETs(Privacy Enhancing Technologies)的风险,并提供可操作的威胁模型与缓解策略。
- 更广泛脉络:回应社会对 AI 隐私的关注(如资料刮取、推论攻击),并借镜联合国 PET Lab 等实务经验。
论文强调,没有框架容易导致「保护措施错置」——例如过度依赖复杂 PETs 而忽略更有效的传统方法,或忽略模型推论阶段的输出风险。
结果 / 成果
论文的主要成果是提出并适配「输入与输出隐私框架」到 AI 系统,提供清晰的系统视角:
1. 框架适配与平行对照
资料系统:
输入隐私(资料摄取/协作计算阶段,使用同态加密、联邦学习等);
输出隐私(资料服务阶段,使用去识别化、差分隐私、合成资料)。AI 系统:
输入隐私对应模型训练/微调阶段(防止开发者与模型学习 PII);
输出隐私对应模型推论阶段(防止输出泄露学到的 PII)。关键差异:AI 模型训练后可与原始资料分离,使用者仅接触模型与输出,降低直接资料存取风险,但引入模型记忆与推论攻击新风险。
2. 威胁模型与缓解表格(Table 1)
- 模型训练/微调:输入 PII、资料中毒、未授权存取 → 输入隐私(去识别化、合成资料、同态加密、联邦学习、稽核)。
- 模型推论:输出学到的 PII、成员推论攻击(Membership Inference)、属性推论攻击(Attribute Inference)→ 输出隐私(PII 抑制、输出加噪、查询限制、监控、分层存取)。
- 持续训练:使用者提示导致的输入 PII 与中毒 → 输入过滤与监控。
- RAG:外部知识库的输入风险 → 类似训练阶段保护。
3. 具体考量
- 输入隐私:传统去识别化与合成资料往往比复杂 PETs 更实用且效能影响较小;需处理使用者提示泄漏与中毒攻击(e.g., PoisonPrompt)。
- 输出隐私:即使输入保护完善,仍需防范模型记忆导致逐字重现训练资料,或推论攻击揭示成员资格。
论文提供高层次工作流程图(Figure 1),清楚标示资料系统到 AI 系统的隐私保护点,具有高度可视化与项目应用价值。
分析与洞见
多角度分析:
相似性与差异:AI 本质上是基于资料系统的「推论引擎」,故传统资料隐私原则高度适用。但 AI 的「黑箱」与泛化能力带来新挑战——模型可能从非直接 PII 推断敏感属性,且大型模型更容易记忆训练资料。
PETs 的务实评估:同态加密、Secure MPC、联邦学习虽理论强大,但效能代价高(e.g., Zama 基准测试显示明显延迟),且无法完全解决中毒或推论攻击。
论文洞见:混合方法更佳——先用去识别化/合成资料处理输入,再辅以政策与稽核。边缘案例与相关考量:
- 持续学习与 RAG:使用者输入或外部检索可能引入新 PII,需即时过滤与监控。
- 雲端部署:资料控制器将资料送至外部训练时,输入隐私尤为关键。
- 攻击向量:不仅 memorization,还有 membership/attribute inference,即使模型未直接输出 PII,也可能泄露「某人是否在训练集」。
- 效能 vs. 隐私权衡:合成资料有时可提升模型效能;过度保护可能降低实用性。
- 组织实务:开发者更熟悉传统控制(如稽核、存取限制),应优先利用既有经验,而非强推先进 PETs。
更广影响:框架促进「资料隐私专家」与「AI 工程师」的语言统一,降低实施错误风险;对开源模型、企业内部部署、公共服务 AI 皆有指导意义。同时提醒,单靠技术不足,需搭配政策、监控与制裁。
潜在限制:论文为 Perspective 文章,较偏概念框架与考量,而非全新实证研究或量化评估。未来可扩展到特定领域(如医疗、金融)或多方协作情境。
结论
论文结论强调,输入与输出隐私框架为 AI 系统提供一个实用、系统性的隐私保护蓝图,帮助开发者与部署者在训练、部署与推论各阶段精准定位风险并选择适当措施。它不仅能降低隐私外泄风险,还促进跨领域合作与标准化语言,最终实现更负责任的 AI 开发。
文章链接:
https://www.frontiersin.org/journals/communications-and-networks/articles/10.3389/frcmn.2025.1600750/full
DOI:10.3389/frcmn.2025.1600750
作者:Zixin Nie、Leena Dave、Rashonda Lewis
发表时间:2025 年 9 月 10 日
期刊:Frontiers in Communications and Networks