一种新的半监督归纳迁移学习框架:Co-Transfer

A New Semi-Supervised Inductive Transfer Learning Framework:Co-Transfer

文益民 ¹员喆 ²余航³

扫码查看

作者信息

1. 桂林电子科技大学计算机与信息安全学院广西桂林 541004;广西图像图形与智能处理重点实验室(桂林电子科技大学) 广西桂林 541004
2. 桂林电子科技大学计算机与信息安全学院广西桂林 541004
3. 上海大学计算机工程与科学学院上海 200444
折叠

摘要

在许多实际的数据挖掘应用场景,如网络入侵检测、Twitter垃圾邮件检测、计算机辅助诊断等中,与目标域分布不同但相关的源域普遍存在.一般情况下,在源域和目标域中都有大量未标记样本,对其中的每个样本都进行标记是件困难的、昂贵的、耗时的事,有时也没必要.因此,充分挖掘源域和目标域中标记和未标记样本来解决目标域中的分类任务非常重要且有意义.结合归纳迁移学习和半监督学习,提出一种名为Co-Transfer的半监督归纳迁移学习框架.Co-Transfer首先生成 3个TrAdaBoost分类器用于实现从原始源域到原始目标域的迁移学习,同时生成另外 3个TrAdaBoost分类器用于实现从原始目标域到原始源域的迁移学习.这 2组分类器都使用从原始源域和原始目标域的原有标记样本的有放回抽样来训练.在Co-Transfer的每一轮迭代中,每组TrAdaBoost分类器使用新的训练集更新,其中一部分训练样本是原有的标记样本,一部分是由本组TrAdaBoost分类器标记的样本,还有一部分则由另一组TrAdaBoost分类器标记.迭代终止后,把从原始源域到原始目标域的 3个TrAdaBoost分类器的集成作为原始目标域分类器.在UCI数据集和文本分类数据集上的实验结果表明,Co-Transfer可以有效地学习源域和目标域的标记和未标记样本从而提升泛化性能.

关键词

半监督学习/迁移学习/多任务学习/双向迁移/集成学习

引用本文复制引用

基金项目

国家自然科学基金(61866007)

广西自然科学基金(2018GXNSFDA138006)

广西重点研发计划(桂科AB21220023)

广西图像图形与智能处理重点实验室项目(GIIP2005)

广西图像图形与智能处理重点实验室项目(GIIP201505)

出版年

2023

计算机研究与发展

中国科学院计算技术研究所中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心

影响因子：2.649

ISSN：1000-1239

参考文献量2

段落导航