科研学术

分享到微信 ×
打开微信“扫一扫”
即可将网页分享至朋友圈
南京大学俞扬副教授做客学术沙龙
文:教师发展中心 来源:计算机学院 党委教师工作部、人力资源部(教师发展中心) 时间:2018-10-19 4771

  10月15日上午,南京大学俞扬副教授做客学术沙龙,在清水河校区宾诺咖啡为我校师生带来题为“面向物理世界强化学习的一些研究进展”的学术报告,分享了他在强化学习方面的研究及进展。计算机科学与工程学院(网络空间安全学院)徐增林教授主持,100多名师生参加讲座。

俞杨.jpg

  在报告中,俞扬分享了他们团队在强化学习方面的工作。他提到,自从Alpha Go在围棋上打败人类之后,强化学习成为了人工智能领域的热点方向,研究者们正在探索如何将强化学习算法应用在现实生活中。他介绍了强化学习的原理以及与监督学习和非监督学习的异同,指明了深度神经网络在记忆和推断能力方面的不足,并给出在深度强化学习上研究者们持有的不同态度,还分享了在应对不同场景强化学习的解决思路,说明了通过提高算法效率、模拟真实数据和模型重用可以提升决策制定的表现。

  最后,他介绍了针对淘宝用户的产品推荐系统。他们团队设计了一个叫“虚拟淘宝”的模拟器,利用真实用户的历史信息,推断用户意图,从而可以准确模拟真实用户的行为,并且使用该模拟器训练了基于强化学习的推荐系统,在实际测试中展现出较好的效果。

  报告深入浅出,给师生们上了一堂丰富多彩的关于强化学习的课程,引起了很多同学和老师热烈讨论。

  本次沙龙由人力资源部教师发展中心主办,计算机科学与工程学院(网络空间安全学院)承办。


  相关链接:

  俞扬,博士,南京大学副教授。主要研究领域为机器学习、强化学习,目前研究集中于提升强化学习样本利用效率。分别于2004年和2011年获得南京大学计算机科学与技术系学士学位和博士学位,获2013年全国优秀博士学位论文奖、2011年CCF优秀博士学位论文奖。2011年8月加入南京大学计算机科学与技术系、机器学习与数据挖掘研究所(LAMDA)从事教学与科研工作。发表论文40余篇,包括多篇Artificial Intelligence、IJCAI、AAAI、NIPS等,获得5项国际论文和竞赛奖,入选2018年IEEE Intelligent Systems杂志评选的AI's 10 to Watch,获2018 PAKDD Early Career Award,受邀在IJCAI’18作关于强化学习的Early Career 报告。



编辑:助理编辑  / 审核:王晓刚  / 发布:王晓刚