科研学术

分享到微信 ×
打开微信“扫一扫”
即可将网页分享至朋友圈
计算机学院本科生在全球计算机视觉顶会CVPR上发表研究成果
文:徐行 图:徐行 来源:计算机学院 时间:2021-03-08 10213

  近日,2021年度IEEE国际计算机视觉与模式识别会议(2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition, CVPR)论文收录结果出炉。我校计算机学院2018级本科生傅阳烨在未来媒体研究中心徐行副教授的指导下,发表题为“Partial Feature Selection and Alignment for Multi-Source Domain Adaptation”的论文。傅阳烨为论文第一作者,徐行副教授为通讯作者,合作单位有美团集团点评搜索技术中心和日本九州工业大学。这是计算机学院本科生首次以第一作者身份在CVPR上发表论文。

  CVPR是人工智能计算机视觉领域最具权威性的国际顶级会议之一,每年召开一届。在谷歌最新发布的2020年度学术指标(Scholar Metrics)榜单中,CVPR以299的H5指数值排名第5位(Nature和Science期刊分列第1和第3位),人工智能领域排名第1位。近年来,CVPR的投稿量逐年增加,据其官网数据显示,2021年度CVPR总投稿量超过万份,有效投稿数约为7500份,最终有1663篇论文被接收,接收率约为27%。被录用的论文主题涵盖了计算机视觉领域的各项前沿工作,本次被录用论文属于多模态领域自适应的研究热点,研究工作为该方向的前沿研究提供了新颖的模型框架。

1.jpg

图1 本论文中提出的多源域领域自适应中的类别偏移问题

  随着计算机视觉与领域自适应的发展,越来越多的领域自适应研究者开始将关注点放在多源域和类别偏移问题上,本次研究将两个问题进行综合讨论,并设计了一个普适的算法框架,希望能在该领域的前沿研究上起到推进作用。该工作针对当前多源域领域自适应研究方法的局限性,开创性地提出了更为实际且更具挑战性的带类别偏移的多源域领域自适应研究方向。考虑到传统的特征提取方法中,源域和目标域存在只有部分特征重合,设计了全新的特征选择框架以及特征对齐损失函数。在领域自适应问题本身上,传统方法大多假设源域和目标域的类别空间完全重合,或者只在单源域单目标域的情况下讨论类别空间的偏移,而该工作将多源域领域自适应中类别空间的限制去除,分析讨论了三种类别空间偏移的情况,最终使用所设计的部分特征选择和对齐算法PFSA解决了最具普适性的类别偏移多源领域自适应问题。论文在多个数据集上进行了两种多源域领域自适应问题的实验,结果表明该方法在两种问题上均显著优于现有模型。

2.jpg 

图2 本论文提出的PFSA模型框架示意图

  傅阳烨同学于2019年进入计算机学院的“拔尖人才培养计划”,在计算机学院未来媒体研究中心徐行副教授指导下进行科研训练和学习。经过近一年时间的努力学习和科研训练,形成了对多源域领域自适应的创新想法,在未来媒体研究中心的平台支持下开展了面向前沿科学问题的研究。

  徐行副教授来自电子科技大学未来媒体中心申恒涛教授团队,他至今已累计发表高水平国际论文90余篇,Google Scholar引用近2500次。在国际顶级期刊和会议(CCF A类会议、IEEE/ACM汇刊等)上发表论文共计40余篇,如IEEE TPAMI、IJCV、IEEE TIP、IEEE TNNLS、IEEE TCYB、CVPR、ACM Multimedia、ACM SIGIR、AAAI等。其中入选ESI高被引及热点论文5篇,并获得6项国际学术期刊及会议论文奖。主持或参与10余项国家级和省部级项目。他荣获2019年IEEE计算机协会大数据专委会颁发的“杰出青年研究员”和2020年电子科技大学“学术新人奖”。徐行副教授在培养本科生参与科研方面具有较丰富经验,已培养来自计算机学院、英才学院、信通学院、格拉斯哥学院等本科学生在国际高水平期刊及会议发表论文近10篇。


  相关链接:

  电子科技大学未来媒体研究中心申恒涛教授团队成立于2014年。团队致力于计算机科学与技术、人工智能等学科在多媒体智能信息处理方面的学科建设、人才培养、科学研究与技术应用。团队现有国家级人才5人,ACM Fellow1人,OSA Fellow1人,省级人才7人,教授/研究员8人,特聘副教授3人,助理教授1人,助理研究员1人,优秀研究生一百人。团队十余名教师均为来自澳大利亚昆士兰大学、新加坡国立大学、日本东京工业大学等海外著名大学的博士。团队主要从事多媒体、计算机视觉、人工智能、信息检索与数据库等领域的国际一流研究。近三年已经在ACM MM、CVPR、ICCV、AAAI、IJCAI、SIGIR、VLDB、ICDE、IEEE TPAMI、IEEE TIP、IEEE TMM、IEEE TCSVT、IEEE TKDE、ACM TOIS、VLDB Journal等CCF A类/中科院JCR二区以上的顶级会议和期刊上发表论文250余篇。相关论文在多媒体、计算机视觉、人工智能和大数据等研究方向产生了较大的国际影响力,并获得了10多项国际会议最佳论文奖项(含提名奖),包括CCF A类国际顶级会议ACM MM和SIGIR等。目前,团队承担国家科技部科技创新2030—“新一代人工智能”重大项目1项、国家自然基金重点项目1项、国家自然基金重点国际合作项目1项,国家自然科学基金企业创新联合发展基金项目1项,以及10多项国家自然科学基金面上和青年项目。



编辑:林坤  / 审核:林坤  / 发布:陈伟