2022年厦门大学现代统计学研讨会圆满举办

  原标题:2022年厦门大学现代统计学研讨会圆满举办

  2022年厦门大学现代统计学研讨会

  2022.12.17-18

  12月17-18日, 厦门大学现代统计学研讨会以线上形式圆满举办。会议邀请5名国内知名学者担任大会特邀报告嘉宾,另设15个分论坛,共59篇论文与会报告。为期一天半的议程中,共超1000人次线上听会。该研讨会也是厦门大学经济学科新百年系列学术活动之一。

  本次会议是厦门大学经济学科自2011年举办“现代统计学与计量经济学国际研讨会”以来,连续第11年定期举办以现代统计学研究为主题的研讨会,旨在发挥厦门大学统计学科的资源优势,搭建促进国内统计学者之间的学术交流和合作的平台,更好地推动统计学科、计量经济学科及相关应用学科的发展,同时加强厦门大学统计学科与各兄弟院校之间的协同合作。

  

  1

  开幕式

  

  17日上午,在厦门大学钟威教授的主持下,开幕式举行。

  

  厦门大学校长助理、研究生院常务副院长方颖教授为会议致辞,代表厦门大学对研讨会的召开表示祝贺,对线上参会的各位嘉宾表示热烈欢迎和感谢。方颖教授简要介绍厦大统计学科的历史沿革,他提到,学科的发展除了自身建设,也离不开与国内、国际学术同行的同台交流,厦大经济学科充分利用国际国内教育学术资源,积极搭建学术交流平台,开展纷繁的学术活动,同行间学术思维碰撞的火花定能进一步促进厦大统计学科乃至国内统计学科实力的提升。

  

  经济学院、王亚南经济研究院副院长(主持工作)周颖刚教授随后致辞。周颖刚教授介绍了厦大统计学科近年来的建设成果,他表示,厦大统计学科在国内形成竞争优势,得益于专家同行的支持和肯定,同时也是对我们委以重任。现代统计学系列研讨会举办11届以来,承蒙各位专家学者的支持,顺利实现搭建高水平学术交流平台的目标,深信通过本次研讨会的举办,通过学术同行的努力,定将推动统计学理论和应用的发展。

  2

  大会报告

  南方科技大学荆炳义教授 、中国人民大学赵彦云教授、东北师范大学郑术蓉教授 、南开大学邹长亮教授 、西南财经大学常晋教授源依次带来精彩主题演讲。

  荆炳义

  南方科技大学

  题目:GNN-based Recommendation Systems with Negative Sampling

  

  

  荆炳义教授首先对推荐系统进行基本介绍,按照方法和数据类型进行分类,指出本文的研究方向为利用协同过滤方法解决这样一类问题场景:只知道用户购买或者浏览了一些产品,但是对于剩下的产品,用户的喜好是未知的。用户和商品之间的关系可以用二分图表征,因此研究的目标是利用GNN提取对应的二分图信息。

  荆炳义提出本文的三个研究重点:第一是embedding的训练,其研究的难点是将分类变量投射到更高维度,可以充分利用更高阶的交叉关系;第二是提出negative sampling抽样方法,处理虚假负样本的问题,在应用场景中,一方面负样本的样本量很大,极大地增加计算成本,另一方面负样本中包含着正样本的信息,因此本文进一步地运用hard false negative样本进行训练;第三是如何克服负抽样中的过拟合问题,本文在构建负样本时混合正样本信息从而增大噪声,引入参数alpha来表示正样本信息的强度。

  荆炳义使用alibaba、amazon等数据进行模拟得到以下结果:首先依据召回率和ndcg两个指标的结果来看,本文提出的Hop-wise Mixing Dynamic Negative Sampling算法效果相较于常见的负抽样算法具有更好的效率;其次是hard false negative样本的难度确定,模拟结果显示并不是难度越高则结果越好;最后是关于alpha的选择问题,文中指出当alpha越大时,模型过拟合程度越低,结果更加稳健。

  赵彦云

  中国人民大学

  题目:统计经济学

  

  

  赵彦云教授通过统计物理学引入了统计经济学的概念,统计物理学通过“其小无内”、:“其大无外”的基本粒子科学基础,以及宏微观完整系统理论方法,推动了物理学思想发展。相比之下,统计学对经济学和社会学的推动作用较小,这也是为什么统计学之于经济学,被称之为经济统计学而非统计经济学。据此,赵彦云提出了“统计经济学”的理论,统计经济学的特殊性是社会关系总和,不仅需要概率统计研究发现统计规律,还需要系统确定社会关系的最大统计边界、最小统计边界、社会生态统计逻辑。

  进一步,赵彦云提出了经济学自身以及统计经济学的重大发展问题。对于前者,教授认为主要包括宏微观完整系统网络,经济金融多体系统,市场价格演变体系,以及社会关系总和的数学和统计理论方法,重要基础工作之一是完成“自然与社会生态系统网络力图解”;对于后者,赵彦云指出其核心在于统计经济学要建立在科学技术现代化基础上,包括互联网数字化智能化技术。

  最后,赵彦云总结并提出了三个观点。第一,注重国家统计工作与国家数据工程包括国有资产管理的数据转型;第二,从学科角度来看,未来发展重点是产品与服务,并进行合理的统计分类动态化,为数据的资源体系构建科学理论方法; 第三,未来发展具有两个趋势:时空动态性时间序列数据处理方法和分类体系的科学理论方法。

  郑术蓉

  东北师范大学

  题目:高维样本协方差矩阵的谱性质及其应用

  

  

  郑术蓉教授分别从研究动机、样本协方差矩阵和样本相关矩阵的极限谱分布(LSD)、这两个矩阵线性谱统计量的中心极限定理(CLT),以及样本相关矩阵在线性判别分析上的应用这四个方面对本报告展开详细介绍。

  首先,郑术蓉提到了两个常用的随机矩阵,即样本协方差矩阵和样本相关矩阵,需要注意的是样本相关矩阵是标准化的结果,具有可比性且尺度不变,而样本协方差矩阵尺度可变。其次,郑老师说明了本研究的两个假定条件,分别是独立成分结构和椭球结构,椭圆结构中包含了重尾分布。

  紧接着,郑术蓉先介绍了样本协方差矩阵的极限谱分布。在协方差矩阵为单位阵的情况下,极限谱分布即经验谱分布的极限,而经验谱分布是由样本协方差矩阵的单位根所组成的经验分布函数。事实上,不论协方差矩阵是否是单位阵,右连续单调上升的经验谱分布都具有一个极限谱分布。郑术蓉还指出对于样本相关矩阵,由其单位根组成的经验分布函数同样有极限谱分布。此外,更重要的一个结论是,无论是在独立成分结构还是椭球结构下,样本相关矩阵的极限谱分布和样本协方差矩阵的极限谱分布是一模一样的,但这两个矩阵的线性谱统计量(LSS)的中心极限定理却有很大的差异。LSS即将一个可测函数作用于样本协方差矩阵或样本相关矩阵的单位根上,再对其进行求和所得到的统计量。而后郑术蓉带领大家推导了两个矩阵的LSS的CLT,要注意须使用无偏样本协方差矩阵和无偏样本相关矩阵。

  最后,郑术蓉介绍了线性判别分析的准则,来判断训练集是来自第一个总体还是第二个总体,以及拓展说明了对角化和正则化的线性判别分析准则,并基于此进一步提出了尺度不变的判别分析规则。

  邹长亮

  南开大学

  题目:AutoMS: Automatic Model Selection for Novelty Detection with Error Rate Control

  

  

  基于上述研究动机,邹长亮将研究内容设定为:提出一种在控制FPR的情况下,可根据不同的数据情况自动选择异常值检测模型的算法。邹长亮的研究思路是,可将此问题转换为多元检验问题,然后采用Benjamini-Hochberg (BH) procedure,将多个假设检验的出错率控制在某一数值以下。

  邹长亮指出,本研究的主要任务是阈值分布的估计和模型选择。在阈值分布的估计上,邹老师认为,虽然前人提出的Single-Random-Splitting (SRS)方法可以在有限样本上实现良好的p值控制,但是不能避免数据集划分的随机性。在这一基础上,邹长亮团队运用Jackknife technique进行改进,并且证明了在三个一般假设下,该方法可以对p值进行有效的渐进控制。在模型选择上,该文提出的算法是在控制所有模型FDR的同时,找到实现最大TDR的模型,也即“最优”模型。

  常晋源

  西南财经大学

  题目:On the Modelling and Prediction of High-Dimensional Functional Time Series

  

  

  常晋源教授指出,现有文献大多聚焦于FTS的一元或固定值,但实际观测到的curve的数量p可能很大,在高维设定下,当p与样本量n相当,甚至大于n时,就会存在以下三方面的挑战:第一,高维统计中p相对于n的高维;第二,函数数据分析中随机函数的无限维性;第三,时间序列分析中的序列相关性结构。同时,常晋源通过实际中的英国气温数据、日本死亡率数据以及能源消费数据来说明p相对n的高维会带来建模上的困难。

  现有文献中对此问题的解决方法有两种:Two-step procedure和连接多个函数来直接对进行降维,但当p很大时,使用Two-step procedure仍会面临高维的问题,而第二种方法仅考虑curve是独立的情形,并未在时间序列的框架下考虑此问题。

  为改进现有研究的不足,常晋源的团队构建的模型为:将观测到的p维FTS即Y t 分解为信号(signal)X t 和白噪声项ε t ,此操作将Y t 建模的问题简化为在X t 的适当basis expansion下对有限维向量时间序列进行建模的问题。常晋源还指出,具体操作中,当p小于等于3时,可直接应用基于自协方差的降维步骤;当p较大时,则采用segmentation transformation加降维的两步法。

  3

  分论坛

  15场分论坛中,59位报告人围绕金融和经济领域的高级时间序列建模、空间计量经济学、复杂数据统计分析、经济统计、宏观经济统计、统计机器学习、应用统计分析、高维复杂数据的统计建模与推断等主题进行了论文报告,并与其余参会嘉宾交流研讨。

  分组报告会I-1

  Advanced Time Series Modeling in Finance and Economics

  

  

  

  

  分组报告会I-2

  Spatial Econometrics

  

  

  

  

  分组报告会I-3

  复杂数据统计分析

  

  

  

  

  分组报告会I-4

  宏观经济统计

  

  

  

  

  分组报告会II-1

  统计机器学习

  

  

  

  

  分组报告会II-2

  现代贝叶斯统计方法和应用

  

  

  

  

  分组报告会II-3

  复杂数据的统计推断和计算

  

  

  

  

  分组报告会II-4

  应用统计分析

  

  

  

  

  分组报告会III-1

  高维复杂数据的统计建模与推断

  

  

  

  

  分组报告会III-2

  Frontiers in Time Series Modelling

  

  

  

  

  分组报告会III-3

  经济统计

  

  

  

  

  分组报告会III-4

  统计估计方法研究

  

  

  

  

  分组报告会IV-1

  时间序列与空间数据的理论研究

  

  

  

  

  分组报告会IV-2

  关于特定模型的统计推断

  

  

  

  

  分组报告会IV-3

  宏观经济统计分析

  

  

  

  

  研讨会由厦门大学经济学院、厦门大学王亚南经济研究院、厦门大学邹至庄经济研究院主办,厦门大学经济学院统计学与数据科学系、“计量经济学”教育部重点实验室(厦门大学)、福建省统计科学重点实验室(厦门大学)承办。

  责任编辑: