首页|基于Group Lasso的多源电信数据离网用户分析

基于Group Lasso的多源电信数据离网用户分析

扫码查看
随着行业竞争愈演愈烈,电信企业的客户流失情况越来越严重,给电信企业造成了巨大损失。通过电信企业的数据来做离网用户的预测,从而进一步作出挽留客户的正确决策,成为电信企业日益关注的问题。面对电信后台汇总的多源数据,经分析发现其呈现天然的组结构。为了选择对于离网类别最具判别性的特征,本文使用了一种基于Group Lasso的组特征选择方法,在此基础上用交叉验证法选择适当的特征组,最终将选择出的少量组特征用于预测离网和停机的宽带用户。实验表明,在江苏某地级市电信离网用户分析数据中取得了比其他特征选择方法的精度平均高至少10%的预测性能。
Group Lasso-Based Feature Selection for Off-network Analysis in Multisource Teledata
With the intensified competition in the industry, customer churn analysis is becoming one of the most significant tasks for the telecom companies,which might lead great financial loss to them. Thus,using the data to predict potential off-network customers and then making business decisions to retain these customers,have drawn lots of attention nowadays. In this paper, we present a Group Lasso-based feature selection method to predict the latent off-network customers by analyzing the corresponding multisource teledata. Specifically, we utilize the cross-validation strategy to choose the optimal sets of feature groups. Extensive experiment results show that the proposed approach has the superior performance(the Precision value is 10% higher than the other methods)on a real telecom dataset derived by a certain city in a prefectural city of Jiangsu.

telecom companiescustomer churnmultisource datafeature selectionGroup Lasso

孙良君、范剑锋、杨琬琪、史颖欢、高阳、周新民

展开 >

中博信息技术研究院有限公司,江苏 南京210012

南京大学计算机软件新技术国家重点实验室,江苏 南京210046

江苏省公安厅物证鉴定中心,江苏 南京210024

电信企业 客户流失 多源数据 特征选择 Group Lasso

国家自然科学基金国家自然科学基金国家自然科学基金国家自然科学基金江苏省科技厅项目江苏省科技厅项目新世纪人才项目江苏省医疗专项江苏省高校研究生科研创新计划项目

61035003611750426102106261305068BK2011005BK20130581NCET-10-0476BL2013033CXZZ13_0055

2014

南京师范大学学报(工程技术版)
南京师范大学

南京师范大学学报(工程技术版)

影响因子:0.313
ISSN:1672-1292
年,卷(期):2014.(4)
  • 1
  • 2