安博网页版在线登录-ANBO(中国)

6月9日:陈康杰
发布时间:2026-06-01 浏览量:23

报告标题:大模型时代的AI安全研究转向:从传统模型攻防到生成式智能安全治理

报告时间:6月9日15:00-17:00

报告地点:理科大楼217

报告摘要:

随着大语言模型与多模态大模型的快速发展,人工智能安全研究正在经历一次重要转向。在传统深度学习时代,安全研究主要围绕CNN、RNN等小模型展开,重点关注后门攻击、对抗攻击、水印保护、模型窃取等问题。这些研究大多聚焦于判别式模型在训练阶段或推理阶段面临的安全风险,以及模型本身的鲁棒性与可控性。进入大模型时代后,模型能力边界显著扩展,应用场景更加开放复杂,安全问题也随之发生深刻变化,研究重点逐步扩展到大模型的内生安全评测、越狱攻击与防御、生成内容安全治理以及智能体安全等新方向。     本次分享将结合这一研究范式的演进过程,系统回顾AI安全领域从传统模型攻防到大模型安全治理的发展脉络,分析两个时代下AI安全问题的异同。报告希望帮助大家建立对AI安全研究演进逻辑的整体认识,理解大模型时代安全研究的新挑战、新机遇与未来趋势。


报告人简介:

陈康杰,天津大学网络安全安博网页版在线登录-ANBO(中国)教授,博士生导师,国家级青年人才,博士毕业于新加坡南洋理工大学。主要从事可信人工智能研究,聚焦大模型安全、智能体安全以及具身智能安全决策等方向。近年来,围绕大语言模型与多模态大模型的安全评测、自动化红队测试、后门攻击与检测、模型安全对齐等问题开展了系统研究。相关成果发表在ICML、ICLR、NeurIPS、USENIX Security、NDSS、IEEE TDSC、TIFS等人工智能与网络信息安全领域重要会议和期刊,并获得了ICLR Oral、CVPR Oral及NeurIPS Spotlight等论文奖。


安博网页版在线登录-ANBO(中国)
安博网页版在线登录-ANBO(中国)地址:上海中山北路3663号理科大楼

                上海市浦东新区楠木路111号
院长信箱:yuanzhang@sei.ecnu.edu.cn | 办公邮箱:office@sei.ecnu.edu.cn | 院办电话:021-62232550
www.sei.ecnu.edu.cn Copyright Software Engineering Institute


安博网页版在线登录-ANBO(中国)