即可将网页分享至朋友圈
教师发展中心“学术沙龙”活动特别邀请上海交通大学黄晓霖教授来校作学术交流。具体安排如下,欢迎广大师生参加。
一、主 题:深度神经网络的训练动态分析:泛化性与反学习
二、主讲人:上海交通大学 黄晓霖 教授
三、时 间:2024年6月17日(星期一)14:00-16:00
四、地 点:清水河校区科研楼C108
五、主持人:信息与通信工程学院 刘翼鹏 教授
六、内容简介:
过参数化是深度神经网络具有良好性能的基础保证,但过参数化使得神经网络的训练损失可以非常小,这些具有相似损失误差的局部解却具有截然不同的泛化性。这使得仅关注训练终态无法分析泛化性,必须考虑整个的训练动态。在之前神经网络的训练动态的低维子空间的基础上,我们深入分析了低维训练、锐度敏感训练等方法以提升神经网络的泛化性,同时训练动态的分析也为反学习等任务提供了新的视角。
七、主讲人简介:
黄晓霖,上海交通大学教授、博士生导师,国家级青年人才。2006年在西安交通大学获得学士学位、2012年在清华大学获得博士学位。此后,在比利时鲁汶大学任博士后研究员,2015年在德国埃尔朗根-纽伦堡大学开展工作并任研究组组长。2016年加入上海交通大学任副教授,2024年晋升教授,现任上海交通大学自动化系副主任。
八、主办单位:教师发展中心
承办单位:信息与通信工程学院 通信抗干扰全国重点实验室
编辑:罗莎 / 审核:李果 / 发布:陈伟