aixiv 专栏重磅发布:无需微调,高效目标移除的扩散模型新方法——attentive eraser
AIxiv 专栏持续关注并报道全球顶尖AI研究成果。过去数年,我们已发布超过2000篇学术技术文章,涵盖各大高校和企业实验室的最新研究。欢迎投稿或联系我们报道您的优秀工作!投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
研究团队: 浙江工商大学统计与数学学院硕士生孙文灏、阿里巴巴算法工程师崔奔雷(共同第一作者),浙江工商大学统计与数学学院董雪梅教授(通讯作者)。
扩散模型在图像生成领域取得了显著进展,尤其在处理高维复杂数据方面优势明显。然而,将其应用于图像目标移除任务时,仍面临诸多挑战,例如移除目标后残留伪影等问题。为解决这些问题,本文提出了一种无需微调的基于扩散模型的目标移除方法——Attentive Eraser,显著提升了预训练扩散模型的目标移除能力。AAAI 2025 录用并选为 Oral Presentation。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

核心创新:
Attentive Eraser 的核心在于其双重创新:
注意力激活和抑制 (AAS): 通过巧妙地修改预训练扩散模型的自注意力机制,增强模型对背景的关注,同时抑制对前景目标的关注。 此外,引入相似性抑制 (SS) 机制,有效避免因自注意力机制导致的对背景中相似目标的误判。
自注意力重定向引导 (SARG): 利用 AAS 修改后的自注意力机制,引导逆向扩散采样过程,从而更精准地移除目标并生成与背景自然融合的内容。

研究背景与方法:
当前,扩散模型如 Stable Diffusion (SD) 在图像生成方面表现出色。然而,直接应用于目标移除任务时,常出现伪影。虽然已有基于微调或提示工程的方法,但这些方法成本高且效果不稳定。Attentive Eraser 则提供了一种无需微调的解决方案,有效解决了这些问题。

实验结果:
MedPeer科研绘图
生物医学领域的专业绘图解决方案,告别复杂绘图,专注科研创新
166
查看详情
实验结果表明,Attentive Eraser 在多种预训练扩散模型上均表现出色,甚至优于一些基于微调的方法。其在目标移除的质量和稳定性方面均取得了显著提升。用户偏好研究和 GPT-4o 评估进一步验证了其优越性。



鲁棒性和可扩展性:
Attentive Eraser 对不同精细度的掩码具有鲁棒性,并可扩展到其他预训练扩散模型(例如,生成动漫图像的模型)。


论文及代码:
07aa1f8be6d3fd558812b


欢迎访问论文链接了解更多细节。
以上就是扩散模型新突破!无需微调,就能高效稳定移除目标物体的详细内容,更多请关注其它相关文章!
# git
# 工程
# 首次
# 就能
# 奥迪
# 移除
# Stable Diffusion
# Hugging Face
# 2025
# red
# 邮箱
# ai
# 威海企业seo平台排名
# 六盘水营销推广网站推广
# 分店营销推广
# 苟延残喘近义词网站建设
# 沈阳网站建设设计
# 福田平台型网站建设
# 外贸seo推广费用计算
# 安徽合肥建设厅网站
# 东营营销推广外包找哪个平台好
# seo软件找28火星
# 浙江
# 应用于
# 多项
# 新突破
# 腾讯
# 还能
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
优化推广96088 】
【
技术知识133117 】
【
IDC资讯59369 】
【
网络运营7196 】
【
IT资讯61894 】
相关推荐:
网友自制 AI 版《流浪地球 3》预告片,登上 CCTV6
史玉柱谈AI:国内最缺是计算数学人才,曾给浙大数学系捐五千万
人工智能驱动智能建筑会是未来趋势吗?
微软bing聊天推出AI购物工具 可进行比价并查看历史最低价
纪录片 《寻找人工智能》全集1080P超清
人工智能改变网络安全和用户体验的三种方式
如何获得元宇宙的第一个属于自己的空间
Meta Connect 2025已确定时间为9月27-28,主题涵盖Quest 3与AI技术
张勇对话多位诺奖得主 人工智能将无处不在
会模仿笔迹的AI,为你创造专属字体
“苏南 vs 苏北” AI 分胜负,娱乐性比较工具 EitherChoice 上线
北京市元宇宙产业创新中心筹建工作正式启动
鸿蒙OS 4将实现AI大模型集成,余承东表示坚持AI辅助而非AI取代
2025 年开发者必须知道的六个 AI 工具
美图吴欣鸿:希望更多人用上AI时代的影像生产力工具
【机智云物联网低功耗转接板】远程环境数据采集探索
如布AI口袋学习机S12 将亮相综艺节目《好样的!国货》
V社回应拒绝上架含 AI 生成内容的游戏:审核政策正在调整中
AI无法对传统文化符号进行解构和创新
创作音乐/音频的Meta开源AI工具AudioCraft,让用户通过文本提示实现
将上下文长度扩展到256k,无限上下文版本的LongLLaMA来了?
爱设计PPT发布第二代AI一键生成PPT产品:智能、个性化、自动化
数字彩排、虚拟建厂!这家顶级洗衣机工厂敲开“工业元宇宙”之门
「社交达人」GPT-4!解读表情、揣测心理全都会
物联网“僵尸网络DDos攻击”增长惊人,威胁全球电信网络
先进技术在防止全球数据丢失方面的作用
华为将于 7 月发布面向 AI 大模型的新款存储产品
华为发布大模型时代AI存储新品
当TS遇上AI,会发生什么?
中国AI公有云市场2025年逆势蓬勃增长,增速高达80.6%
报道称亚马逊正在测试AI生成产品评价摘要
掌阅科技对话式AI应用“阅爱聊”开启内测
OPPO三方联合发布AI可持续发展白皮书,坚持发展健康AI生态
2025年深圳举办的SUSECON 创新峰会开始接受报名
五个出色的人工智能应用实例
华为云发布华为云盘古模型3.0和升腾AI云服务,亮点亮相2025华为开发者大会
人工智能正在弥合认知和表达之间的鸿沟
首家承认ChatGPT影响其收入的公司Chegg选择拥抱AI ,裁减4%员工
学界业界大咖探讨:AI对数字艺术创新的推动力
国产医疗企业的人工智能
加州用AI监测野火:1032个摄像头联网扫描森林异常
微软推出 LLaVA-Med AI 模型,可对医学病理案例进行分析
解决导航“最后50米”难题 高德地图升级AR步行导航找终点功能
特斯拉 Optimus 人形机器人入驻北美门店,帮助提升汽车销量
参议院司法听证会:AI 不易管控,有可能被恶意分子利用来研发生化武器
智能机器人正在彻底改变客户服务
【澎湃原动力】人工智能产业协同创新中心:全产业链资源在这里汇聚
梦想实现!硬核科幻大片VR智能头盔即将问世
对话无界AI创始人长铗:AI的创业机会在应用层丨创新者Innovator
联想举办2025创新开放日,展出260余项算力及AI产品技术
2025-02-24
运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。