首页|基于手机信令数据的位置预测

基于手机信令数据的位置预测

吴雨佳

基于手机信令数据的位置预测

吴雨佳1
扫码查看

作者信息

  • 1. 长春理工大学
  • 折叠

摘要

随着移动通讯技术的发展和互联网的普及,人们对手机的依赖性越来越强,由此产生了大量的手机信令数据,其中包含的用户位置信息具有重要价值.近年来,基于位置的服务蓬勃发展,如交通管理、城市规划、店铺推荐、传染病防控等,有效的位置预测是实现上述应用场景的关键.以往对用户轨迹位置的研究大多使用的GPS定位数据,由于该数据难以搜集,因此研究的局限性较大.手机信令数据具有实时性、完整性、出行时空全覆盖性的优势,因此利用手机信令数据对用户的位置进行预测能够给各类服务提供便捷. 手机信令数据存在采样不均匀以及因信号不稳定产生漂移、异常切换等问题;除此之外,运营商采取的定位技术不同导致定位精度不同,因此难以获取细粒度的移动轨迹.针对上述问题,本文探究用户语义化的轨迹,即由用户活动的停留点构成的轨迹序列,对用户下一个可能要去的位置进行预测.本文的主要工作介绍如下: 首先针对手机信令数据中各种噪声定位点设计相应的清洗方法.去除误差定位后,对于仍然不利于停留点提取的冗余位置信息设计一种可循环迭代的数据清洗方法.然后分别采用扩展时间维度的ST-DBSCAN聚类算法和以基站小区为停留点提取单元的时间阈值方法提取停留点,将停留点串联成用户轨迹位置序列.为了获取用户轨迹的语义特征,利用基站小区内的兴趣点信息给每个基站小区标注功能属性,如餐饮服务、风景名胜、科教文化等,生成含有语义特征的轨迹序列.最后,本文建立一个强化位置间语义关联的LSTM位置预测模型,在LSTM网络层之前构建一个embedding层,将稀疏的one-hot位置编码转化成位置嵌入向量,强化位置间的语义关联.实验证明,本文的数据清洗方法能够有效识别噪声数据且具有良好的数据沉降效果;ST-DBSCAN密度聚类算法不适用于本文CELL-ID定位方式的手机信令数据,而简单的时间阈值的方法能够提取停留点;相比较频繁模式挖掘和马尔可夫模型,本文的LSTM位置预测模型准确率较高,能够达到良好的预测效果.本文验证了利用手机信令数据预测用户位置的可行性,对交通治理、广告投放、传染病防控等方面具有一定的参考价值.

关键词

手机信令数据/位置预测/LSTM神经网络/停留点/数据清洗

引用本文复制引用

授予学位

硕士

学科专业

应用统计

导师

尹伟石

学位年度

2021

学位授予单位

长春理工大学

语种

中文

中图分类号

C8
段落导航相关论文