High-Dimensional Reinforcement Learning by Multi-Armed Bandits
数学专题报告
报告题目(Title):High-Dimensional Reinforcement Learning by Multi-Armed Bandits
报告人(Speaker):刘克勤(西交利物浦大学)
地点(Place):后主楼1225
时间(Time):2025 年 5月 19日 上午10:00-11:00
邀请人(Inviter):苏喜锋
报告摘要
The main challenge in machine learning is the complexity of high-dimensional problems. The way of data sampling itself becomes crucial during the learning evolution process. The tradeoff between exploration and exploitation is well modeled by the Multi-armed Bandit (MAB) problems. In this talk, we present some recent results from my own group on the techniques innovated to solve such high-dimensional reinforcement learning problems. Furthermore, we will illustrate the process of transforming pure math theories (such as algebraic topology) into applied fields for efficient algorithm developments and optimizations.
主讲人简介
刘克勤于2010年获得加州大学戴维斯分校电子计算机博士学位并留校做了2年博士后与讲师。2012年至2020年期间,刘博士在美国加州硅谷的各大高科技公司(如ASML)任职高级软件工程师。2020年,刘博士入职南京大学数学系任教并聘为江苏国家应用数学中心特聘研究员。2024年,刘博士入职西交利物浦大学数理学院的金融与精算数学系任副教授至今。在工业界,刘博士研发的各类高科技产品(如高精度惯性导航系统、电子晶圆检测校正算法等)获得了全球市场的良好评价并于2018年获得美国KLA公司技术突破奖。在学术界,刘博士在国际顶尖期刊会议中发表40余篇学术论文(2600+引用),并获得2011年美国特殊人才引进资格、2012年加州大学戴维斯分校工程学院最优博士论文、2021年南京大学紫金学者(80万经费)与数学系郑刚学者(30万经费)、2023年南京大学志坚奖教金(数学系优秀教学奖)、2024年江苏省应用统计学会论文一等奖,以及2024年苏州独墅湖高教区青年科教领军人才项目等。