首页期刊导航|数理统计与管理
期刊信息/Journal information
数理统计与管理
数理统计与管理

杨振海

双月刊

1002-1566

sltj@amt.ac.cn

010-62521341

100190

北京中关村东路55号思源楼911室中国科学院应用数学所内

数理统计与管理/Journal Jouranl of Applied Statistics and ManagementCSSCICHSSCDCSCD北大核心CSTPCD
查看更多>>本刊为统计学学术期刊。刊登数理统计、应用概率、运筹学及经济数学方法等方面的研究成果及其在工业生产、管理、科研、农医生物等领域中的应用成果。主要栏目有:应用成果、方法的探讨与研究、软件的学习与应用、争鸣与评论、统计学等。读者对象为各级管理人员、技术人员、数理统计工作者、高等院校有关专业的师生。
正式出版
收录年代

    基于"三新"经济动态总体的事后分层抽样方法

    张维群成鹏东杨静宜
    951-961页
    查看更多>>摘要:"三新企业"是新经济企业的重要组成部分,科学地抽样推断"三新企业"规模及水平有利于准确及时地掌握新经济发展的现状,对于"三新企业"的抽样调查也是当前经济统计学界关注的主要问题.文章基于固定抽样框无法反映"三新企业"抽样调查中总体容量及结构频繁变动的特点,设计了基于"三新"经济动态总体的事后分层抽样方法,首先通过多重连续抽样,实现对总体容量变动的估计,以及对动态抽样框的修正和事后分层处理,然后依据复合抽样技术,构建基于"三新"经济动态总体相关参数的复合估计量,并对估计量的优良性进行讨论.模拟结果显示,基于"三新"经济动态总体的事后分层抽样方法能够实现目标变量的有效估计,构造的总体参数估计量具有无偏性和有效性.

    动态总体事后分层多重抽样复合估计量

    稳健双自适应惩罚权重expectile方法及其在GDP数据中的应用

    严笑文诗涵邹航
    962-972页
    查看更多>>摘要:为了解决杠杆点存在时,惩罚expectile回归和惩罚分位数回归失效问题,基于expectile回归和稳健双自适应惩罚权重回归估计方法,本文提出了一种稳健双自适应惩罚权重expectile回归估计方法.该方法可以在自变量和因变量都含有异常值时,实现稳健变量选择和异方差检测.对于提出的模型,本文首先利用MM算法构建替代惩罚函数的优控函数,随后用迭代加权最小二乘算法估计参数,惩罚参数通过最小化BIC准则获得.模拟和实证表明,当数据中存在杠杆点时,所提方法在变量选择和异方差检测效果上优于惩罚最小二乘方法和惩罚分位数回归方法.

    稳健双自适应惩罚权重expectile回归变量选择异方差稳健性

    多维分层人口随机死亡率模型及其应用

    赵明王晓军
    973-984页
    查看更多>>摘要:人口随机死亡率预测是养老金管理者和保险公司度量长寿风险的基础,其中多人口随机死亡率建模是当前研究的前沿与热点.本文将传统的单一维度下性别人口或地区人口模型,扩展为性别人口与地区人口相联合的多维模型,提升人口随机死亡率建模的系统性.同时,引入超参数构建分层模型,采用马尔可夫链蒙特卡罗模拟和数据克隆技术改进参数估计方法,以弥补传统方法中先验假设主观性强和拟合结果不稳定的问题.通过比较研究,发现多维分层人口随机死亡率模型不仅提高了样本内拟合优度与短期预测效果,并且长期预测结果更加符合人的生物规律.

    人口死亡率贝叶斯分层模型数据克隆长寿风险

    地铁刷卡数据的动态统计模型

    牟唯嫣代铁林熊世峰
    985-994页
    查看更多>>摘要:本文针对地铁客流分析问题,建立了乘客进出站刷卡时间数据的动态统计模型.该模型不需要已知列车时刻.我们提出了一个EM算法来求解模型中未知参数的极大似然估计.应用所提模型,可以基于乘客进出站刷卡时间数据推断高峰与非高峰时段的列车时刻、乘客乘各趟车的概率、乘客出站走行时间分布、乘客旅行时间分布等描述地铁系统的指标.模拟实验表明本文的EM算法能较准确地估计动态统计模型中的未知参数.通过所提模型分析了北京地铁6号线的实际数据,给出了高峰与非高峰时段客流特征的若干量化指标刻画.分析结果表明乘车时段对乘车概率和出站走行时间分布有显著影响.基于所提模型构造了乘客出站刷卡时间的动态预测区间.在测试集上的计算结果表明区间的实际覆盖率与名义覆盖率相吻合,这也显示了所提模型的有效性.

    城市交通logistic模型极大似然估计地铁客流EM算法

    一种整合转录组和基因组数据的关联检验

    江珍珍李娜
    995-1009页
    查看更多>>摘要:整合不同组织间的表达数量性状基因座信息不仅可以提高识别与疾病相关的基因的能力,而且有助于理解基因调控机制.针对每个基因,MultiXcan方法对组织间预测基因表达数据进行主成分分析,采用多元线性回归模型的F检验进行基因与表型的关联检测.复杂疾病通常由多个遗传基因协同作用,当单个基因对复杂疾病的影响都较小时,MultiXcan方法检测关联基因的能力较差.此外,MultiXcan选取前几个主成分作为变量用于构建模型存在丢失部分有用信息的风险.本文通过整合所有基因在不同组织上的基因表达的预测值来寻找与复杂疾病有关联的基因.首先,我们分别对每个基因在不同组织上的预测表达进行主成分分析.与MultiXcan不同的是,我们采用Lasso方法对所有主成分进行变量选择,然后对被选择的主成分构建多元线性回归模型.最后利用Wald检验和FDR校正来检测每个基因与表型的关联性.数值结果表明新方法能显著提高识别目标基因的能力,不仅在大多数情况下都优于MultiXcan,并且达到同样功效所需的样本量也比MultiXcan方法小得多.

    LassoFDR功效全转录组关联研究表达数量性状基因座

    随机区组区间删失场合下威布尔分布模型的参数估计

    周晓东吴琳岳荣先
    1010-1024页
    查看更多>>摘要:区间删失数据是工业和生物医学中一种常见的不完全数据类型.以往对区间删失数据的分析通常假定数据独立同分布,然而在实际应用中,试验产品所用原材料、试验平台等因素的影响使得试验数据之间存在区组结构,导致同一区组下的数据存在相关性.首先,本文考虑随机区组区间删失场合下威布尔分布模型的统计推断问题.给出了模型参数估计以及产品寿命特征预测的两步估计法、极大似然估计方法以及贝叶斯估计方法.其次,本文探讨了最优区间删失方案的设计,给出了基于蒙特卡罗模拟的最优设计方法.模拟和实际数据分析结果表明所给方法是可行且有效的.

    随机区组效应区间删失威布尔分布Gibbs抽样Gauss-Hermite近似最优试验方案

    断代缺失数据下受控分枝过程的极大似然估计

    王艳清刘金灵
    1025-1036页
    查看更多>>摘要:受控分枝过程是描述种群进化的一类重要模型,其中后代分布和控制分布决定了种群的进化特征,估计这些分布的参数对于过程的预测和控制至关重要.但在实际中,常常会由于观察的间断性或者资料丢失造成样本数据的断代缺失,这给参数估计带来一定的困难.本文主要是基于断代缺失数据,在一些正则假设条件下,推导了缺失样本的分布函数,基于EM算法,得到具有随机控制函数的受控分枝过程中若干参数的极大似然估计,并通过数值模拟验证了该方法的有效性.最后,我们利用此方法对2020年1月23日-2月16日杭州市COVID-19数据进行了实证分析,探索了 COVID-19病毒在杭州市的传播机制,评价了疫情防控政策的实施效果.

    受控分枝过程断代缺失数据极大似然估计EM算法

    函数型时间序列的自适应分类预测方法及其在高频数据中的应用

    王德青芦智昊薛守聪徐妍...
    1037-1052页
    查看更多>>摘要:实时记录的高频数据呈现出显著的连续函数特征,无穷维等复杂本征结构使得传统分类和预测方法凸现弊端.针对函数型时间序列的波动模式识别和实时动态预测,本文提出自适应分类基础上的混合期望预测方法,并给出具体算法流程.(1)基于无核心信息损失的空间映射重构客观赋权的加权主成分距离,并以此量化函数之间的疏密程度进行初始类别划分;(2)综合检验类别函数之间均值和特征展开空间的显著性差异,提出潜在类别数目的确定准则以及对初始分类结果进行迭代更新的优化算法;(3)基于收敛的优化再分类结果建立函数类别归属的判别准则;(4)对干部分观测的新函数,分别计算其类属的后验概率以及其在每一子类别的预测值,并以类属概率为权重加总新函数在所有类别的预测值,构建日内信息迭代更新的函数型混合预测模型.基于多种情形的数值模拟和高频的上证综指预测分析发现,函数型时间序列的自适应分类预测不仅可以有效识别日内波动的类别模式,而且能够显著提升预测准确率,并且其相对优势保持稳健.

    函数型时间序列自适应分类混合预测迭代更新高频数据

    两阶段设计中单比例的精确置信区间构造

    尹环王维真
    1053-1064页
    查看更多>>摘要:在Ⅱ期临床试验中药物疗效不确定的情况下,通常要求参与试验的人数尽可能少.二项分布下单比例的估计多使用基于大样本的渐近区间.Ⅱ期临床试验中大样本一般得不到,因此希望给出参数的精确置信区间,即极小覆盖概率不低于1-α.在两阶段优化设计背景下,本文将依据Clopper-Pearson区间和反搜索法给出原始样本空间上的一个合理秩函数,并在该秩函数下构造最优的精确单侧置信区间.从在整个参数空间上的覆盖概率图可以看出,该置信区间的置信系数不低于1-α.进一步,以期望区间长度为评价标准,将提出的新区间与两个已知的精确区间进行比较,发现新区间期望长度更短.最后以乳腺癌药物-奥拉帕尼的数据(2018年3月至2020年1月)为例,给出该药物疗效率的最优精确下单侧置信区间.

    二项分布Ⅱ期临床试验期望区间长度秩函数置信系数

    具有较少整区因子的一般最小低阶混杂裂区设计的构造

    刘艳丽赵胜利
    1065-1072页
    查看更多>>摘要:裂区设计在工业试验中具有重要应用.一般最小低阶混杂(GMC)准则是选取最优裂区设计的准则之一,GMC准则下的最优裂区设计称为GMC裂区设计.目前为止,计算机辅助搜索是唯一的构造GMC裂区设计的方法,但是这种方法太耗费时间.本文提出了构造具有较少整区因子的GMC裂区设计的理论方法,利用这种新方法可以很容易地得到一类GMC裂区设计.

    因子设计同构设计别名效应数型