统计与大数据研究院博士生研究生黄君烈和孟澄助理教授合作发表高水平论文

  杠杆值用于量化数据会合各数据点的影响力,普遍行使于子抽样伎俩以提取具有代外性的子样本。本文针对二维自回归模子中杠杆值的盘算推算与行使题目开展深切琢磨。基于其协变量矩阵的组织特色,咱们立异性地提出了二维自回归模子杠杆值的递推盘算推算公式,并据此策画了一种高效的近似盘算推算算法。正在外面层面,咱们外明了该近似伎俩的差错上界,并对其盘算推算庞杂度实行了编制解析。通过普遍的数值模仿和实正在数据实践,咱们验证了该伎俩的职能、效果与稳妥性,及其正在超光谱图像格外检测职业中的价格。

  二维自回归(Two-dimensional Autoregressive,简称2D AR)模子因其能描绘二维数据的特定组织而正在图像处分、图像压缩职业中有很强的行使潜力。然而,用最小二乘伎俩拟合2D AR模子的盘算推算庞杂度较高,越发正在模子阶数未知的状况下,必要拟合分别阶数的模子以实行阶数挑选,很大水平上局限了2D AR模子的适用价格。

  本文提出了一种速捷算法,能够高效地对2D AR模子实行模子阶数挑选,杠杆值预计,和参数预计。对一个包罗N个像素点,d个参数的2D AR模子,该算法能够将阶数挑选中每个子模子的均匀盘算推算庞杂度降至O(Nd)。算法取得参数预计的差错上界存正在外面保障。豪爽数值实践注脚,所提算法正在连结与随机抽样雷同岁月庞杂度的同时,完成了与杠杆值子抽样伎俩相当的参数预计精度。

  本文提出了一种基于2D AR模子杠杆值的图像格外检测伎俩。杠杆值量化了单个数据点正在模子中的影响,而格外像素日常具有较高的杠杆值,因而2D AR模子的杠杆值能够自然地行动评估像素格外水平的一种目标。数值模仿实践结果显示,该伎俩正在含有自干系噪声的低信噪比条目下仍能连结优异的格外检测职能,可无误识别图像中的格外像素区域。正在实正在数据上,相较于主流的图像格外检测伎俩,本伎俩不单得到了变更确的检测结果,同时出现出明显的盘算推算效果上风。

  黄君烈,中邦黎民大学统计与大数据琢磨院2022级博士生,明理立异实践室Stat2Spark团队理事,重要琢磨目标为大数据子抽样、图像格外检测和非参数统计等。目前已有一篇论文被《Journal of Computational and Graphical Statistics》回收,曾入选宇宙工业统计学教学琢磨会青年统计学家协会年会博士生论坛获海报出现时机。深度到场华为“困难揭榜”,行动中枢成员斩获一枚火花奖,两枚驱策奖。

  孟澄,统计与大数据琢磨院助理传授、博士生导师。中邦大百科全书(第三卷)统计学卷-数据科学分卷副主编。重要琢磨目标为:大数据压缩、最优输运伎俩、统计及工业交叉科学等,正在Biometrika, IEEE TPAMI, TNNLS, JMLR等期刊聚会上楬橥论文二十余篇。重要琢磨目标为大数据速捷算法、最优输运题目等,主办邦自科青年基金。孟澄指导团队得到华为“困难揭榜”价格火花奖三枚、驱策火花奖三枚,指点博士生李梦雨得到2024年度中邦科协青年人才托举工程博士生专项盘算(托举学会:中邦现场统计琢磨会)。

  2020年以后,琢磨院学生正在统计学、计量经济、呆板练习等范畴邦际一流学术期刊上楬橥了26篇高程度论文。