☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
论文第一、第二作者为复旦大学视觉与学习实验室的硕士生韩枫和博士生陈凯。通讯作者为陈静静副教授。研究团队专注于 AI 安全的研究,近年来在 CVPR,ECCV,AAAI,ACM MM 等顶会上发表过多篇 AI 安全的研究成果。文生图模型生成图片过于露骨?不妨直接给图像穿上衣服。复旦大学团队设计的风险概念移除网络 DuMo 不仅实现上述功能,同时尽可能保证人物以及其他属性不受影响。达到现有最好的指哪擦哪效果。同时,DuMo 也可避免文生图模型模仿艺术家风格,从而制作一些侵犯版权的照片。随着生成式人工智能技术的快速发展,扩散模型图像生成能力已达到了令人惊叹的高度。然而,这一技术也伴随着安全隐患,例如生成含有敏感、不当或侵犯版权的内容。现有方法一般通过一种名为概念陈擦除的微调方法以实现模型去毒。复旦大学研究团队提出了一种全新的双编码器调制网络(DuMo),通过创新性的架构和算法,实现了对扩散模型中特定风险概念的精准擦除,在擦除效果和精确度方面均达到 SOTA 水平,研究成果已被顶级会议 AAAI 2025 收录。
- 论文:DuMo: Dual Encoder Modulation Network for Precise Concept Erasure
- 论文链接:https://arxiv.org/abs/2501.01125
当前的概念擦除技术普遍面临两个挑战:一是难以有效擦除风险概念,二是擦除过程中,微调后模型对其他安全概念的生成能力被破坏。DuMo 在这两个方面取得了突破,成功地解决了「擦除」和「保护」之间的矛盾。具体而言,U-Net 特征分为主干网络特征,和跳跃连接特征。其他方法都对 U-Net 的主干特征进行了修改,会对安全概念的生成产生不良影响,破坏其结构完整性 [1]。此外,跳跃连接特征的潜力没有得到充分挖掘,这限制了模型在执行概念擦除时的能力,同时也影响了模型的生成效果 [2]。DuMo 通过对 EPR 擦除模块和时间 - 层级调制机制(TLMO)的两阶段微调以实现上述效果:DuMo 采用了创新性的「基于先验知识的擦除模块」(EPR)。EPR 擦除模块是由一份 U-Net Enoder 的副本和零卷积组拼接得到的。零卷积组的卷积层参数被初始化为零,而且原始 U-Net 主干的参数被冻结,其包含的模型先验知识被全部保留,只有跳跃连接特征被修改,从而最大程度避免对安全概念的结构和生成质量产生负面影响 [1]。第一阶段微调过程中 DuMo 将不安全概念(例如「裸露」)对齐到目标概念(例如,空文本 「 」)以达到概念擦除的效果作者观察到,EPR 模块在不同的跳跃连接层和去噪时间步上,对图像中的低频结构元素和高频细节部分表现出不同的擦除偏好。通过将跳跃连接层和时间步分组,DuMo 发现不同层级和时间步对图像的影响不同,因此采取了特定的调整策略。DuMo 设计了一个独特的时间 - 层级调制(TLMO)策略,针对扩散模型的生成过程中的不同时间步和网络层级,使用微调得到的调制系数,自动调整 EPR 模块不同输出的擦除强度。同时在第二阶段的微调过程中,除了损失函数中原有的项外,还添加了一个正则项,用于将微调后的模型噪声(对应空文本)与原始模型进行对齐。这些机制大幅减少对安全概念的影响,从而在擦除风险概念的同时,保证安全概念的生成质量和细节。DuMo 在裸露内容擦除、卡通概念移除和艺术风格擦除三个任务上进行了全面验证,其表现优于当前所
有主流方法。在风险性最高的「裸露内容擦除」任务中,DuMo 在 I2P 基准数据集上的表现令人瞩目:
在擦除裸露概念后,DuMo 还能很好的保持图像的结构。如第一行人物的姿势和第二行人物位置与背景。针对「Snoopy」等流行卡通概念的擦除任务,DuMo 实现了更好的平衡:
在艺术风格移除任务中,DuMo 精准擦除了「梵高」和「伦勃朗」等风格特征,同时对其他艺术家风格的破坏降到最低:
在擦除梵高风格的实验中,其他艺术家风格图片的生成也不受影响。[1] Si, C.; Huang, Z.; Jiang, Y.; and Liu, Z. 2025. Freeu: Free lunch in diffusion u-net. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 4733–4743.[2] Luo, W.; Hu, T.; Zhang, S.; Sun, J.; Li, Z.; and Zhang, Z. 2025. Diff-instruct: A universal approach for transferring knowledge from pre-trained diffusion models. Advances in Neural Information Processing Systems, 36.
相关推荐:
AI写文章的新时代:赋能内容创作的智能革命
ChatGPT为什么访问不了?全面解析及解决方案,ai首页设计
AI搜索相似文章怎么做?揭秘高效文章检索的核心技术!,程式ai软件
AI免费写作一键生成,效率与创意的完美结合
SEO网页优化:提升网站流量与排名的终极秘籍
ChatGPT恢复正常使用时间,提升你的工作与生活效率,联想电脑AI0510
独立站网页优化:提升网站竞争力的核心利器
AI写作的文章算原创吗?深度技术与创作的边界
ChatGPT4网页空白:重新定义智能交互的未来,怎么登ai
如何通过SEO引擎优化提升网站关键词排名,助力网站流量增长
AI写作免费一键生成5000字:高效创作的革命性工具
轻松写作,无忧创作生成作文的网址,提升写作效率
Bing学术搜索结果不显示时间?如何解决这一问题,提升学术研究效率!,ai怎么参考线
文章写作AI:让创作更高效、精准的智能助手
seo涉及什么内容,seo主要包括 ,ai模拟拍照
搜索引擎广告优化:助力企业提升精准曝光与转化率
强大、智能、高效文章创作的全新世界
ChatGPT5.0为什么一直没出来?背后的技术与战略,元宵节ai趣赏月
ChatGPT对于大数据发展的帮助:赋能行业变革,推动智能化未来,ai写作真的好吗
AI写文章原理:颠覆写作的革命性技术
娄底网站优化提升品牌影响力的关键一步
ChatGPT坏了用什么?替代方案,满足你的智能对话需求,星际一的ai
AI写作是怎么形成的揭开人工智能赋能创作的奥秘
seo有什么,seo是干吗的 ,元気江挽ai皖莓
如何利用“网站关键词SEO”提升网站排名,助力企业快速增长
ChatGPT支付时银行卡被拒绝?教你几招轻松解决问题!,国内ai换图
seo是什么姓,seo什么意思中文意思 ,ai对策
seo是什么职业 学院,seo专业学校 ,ai制作空间文字效果
AI写文:智能创作时代的新篇章
免费的AI写作工具有哪些?助力内容创作的高效助手
AI写文章机器人:开启智能写作新时代
让AI关键词提炼助力内容创作:提升效率与精准度的秘密武器
seo是什么站外流量,seo主要流量来自什么页面 ,围棋ai跟象棋ai
AI创作的文章属于原创吗?人工智能与原创性的未来
AI写作会出现同一篇文章吗?AI创作的无限可能
网站优化的含义是什么?助力企业腾飞的关键策略
ChatGPT免登录:轻松畅聊,无需注册,快速体验AI智能助手,眼泪ai
轻松生成文章!让你在创作中游刃有余的工具推荐
适合写作的笔记软件,让你的创作更高效
seo有什么作用,seo的意义和作用 ,ai写作优点
如何设置SEO优化,让网站在搜索引擎中脱颖而出
为什么要监控SEO效果,国家为什么要监控个人 ,ai辅助学习考核
用AI优化文章,轻松提升内容质量与创作效率
高效创作新时代AI文案速写工具,让创作更轻松
ChatGPT打不开了吗?如何快速解决常见问题,恢复顺畅体验!,ai13212511845
网页涡旋生成器:轻松打造引人入胜的互动效果
个人网站SEO优化:打造可持续增长的网络名片
SEO网站关键词优化怎么做,轻松提高网站排名
AI合并文章让内容创作更高效、更智能的解决方案
AI如何写文章?开启内容创作新时代