深度学习的数学理解
数学专题报告
报告题目(Title):深度学习的数学理解
报告人(Speaker):张世华(中国科学院数学与系统科学研究院)
地点(Place):腾讯会议 642-913-080
时间(Time):2022 年 03 月 30 日 周三 15:00-16:00
邀请人(Inviter):蔡永强
报告摘要
深度学习特别是深度神经网络作为一种黑箱模型,是通过大量计算实验得到的,其数学原理逐渐引起研究者的广泛关注。本报告将从不同的角度介绍深度学习的数学理解与认识,特别介绍两种初步尝试。第一,从多层卷积稀疏编码模型的编码初始化和字典矩阵设计的角度,分别建立残差神经网络和多尺度密集连接网络与多层卷积稀疏编码模型的等价联系。第二,提出深度学习是在 Wasserstein 空间学习测地曲线的理论。在维度不变的情况下,刻画深度神经网络所学习到的映射近似最优传输映射,即数据点的表示在模型内部近似沿着直线传输,进而解释为什么残差网络相比于普通神经网络具有更好的优化和泛化能力。
主讲人简介
张世华,中国科学院数学与系统科学研究院研究员、中国科学院随机复杂结构与数据科学重点实验室副主任、中国科学院大学岗位教授。主要从事生物信息计算、机器智能与优化,主要成果发表在 Cell、Nature Communications、Advanced Science、National Science Review、Nucleic Acids Research、IEEE TPAMI、IEEE TKDE、IEEE TNNLS 等杂志。曾荣获中国青年科技奖、国家自然科学基金优秀青年基金、中组部万人计划青年拔尖人才、中国科学院卢嘉锡青年人才奖、全国百篇优秀博士论文奖等。成果入选 2021 年度中国生物信息学十大进展、2019 年度中国生物信息学十大算法和工具。