随着互联网的迅速发展,涉网犯罪占比已经超过37%,而其中侵犯公民个人信息犯罪更是高发多发.侵犯公民个人信息犯罪不仅扰乱公民私人生活的安宁,由其滋生的下游犯罪如电信诈骗、网络盗窃、敲诈勒索等还严重危害公民的人身、财产安全,甚至对国家安全造成威胁.各地公安机关在侵犯公民个人信息行为发现方式上较为单一,而机器学习中的随机森林模型对于计算资源要求不高,较为简单实用.研究先通过Word2vec模型进行样本数据的文本特征向量构建,进而分别搭建决策树和随机森林模型开展训练,最后对训练结果进行实验和分析.实验证明,使用随机森林模型能够较为出色的实现侵犯公民个人信息行为发现,提升公安机关挖掘侵犯公民个人信息犯罪线索的效率.