近日,永乐高60net2023级本科生施奕彤第一作者论文被计算机视觉顶级会议ECCV 2026录用,论文题目为“One Trap to Block Them All: Defending Encoder Stealing via Isotropic Uniformity”。该论文提出了针对自监督编码器模型窃取的新型主动式防御方法,指导教师为韦康副研究员和霍赋硕研究员。

图1 UniTrap防御方案架构图
随着人工智能技术的快速发展,自监督学习(Self-Supervised Learning,SSL)模型因其强大的表征能力被广泛部署为“编码器即服务”(Encoder-as-a-Service,EaaS)平台。然而,高性能编码器在开放服务过程中面临模型窃取风险,攻击者可通过有限查询构建功能接近原模型的替代模型,严重威胁模型知识产权与商业价值。传统的防御方法通常堆叠复杂的模块或依赖启发式的噪声,往往顾此失彼,难以兼顾安全防护与模型的正常可用性。针对上述问题,论文提出了一种名为UniTrap的新型主动式防御方法,首次从特征空间几何结构角度出发,通过高斯势函数主动诱导编码器输出特征在单位超球面上形成各向同性均匀分布,从根本上破坏攻击者所依赖的对比学习对齐过程。论文从理论上证明,当目标特征达到理想均匀分布状态时,模型窃取过程中关键的对比学习梯度将发生抵消并趋于消失,从而使攻击者训练过程陷入停滞。广泛的实验证实,该方法在多个基准测试中均实现了隐私保护和模型效用的平衡。
ECCV主要涵盖计算机视觉、人工智能、图形学、多模态感知等方向的前沿理论、创新算法与落地应用成果,与CVPR、ICCV并称为计算机视觉领域三大国际顶级会议,每两年举办一次,与ICCV交替举办,是中国人工智能学会和清华大学推荐A类会议。此次论文被收录,进一步展现我院本科生能够独立完成人工智能安全前沿课题完整科研闭环的综合科研实力,研究成果在国际高水平评审中获得学术界认可,充分彰显学院在人工智能安全领域本科拔尖创新人才培养体系持续见效、成果丰硕。
(文字:韦康 审核:张璐)



