摘要
生成式人工智能对人类生活方式、工作方式乃至认知方式产生了深远影响.未来,AIGC将成为内容生产的主力军之一.通过回顾生成式人工智能大模型的发展和应用情况,总结了当前生成式人工智能面临的法律风险、道德风险、歧视和偏见、虚假信息和模型自身安全风险等相关安全风险,分析了各类安全风险产生的原因,并阐述了生成式人工智能内容安全机制的必要性和重要性.生成式人工智能内容安全机制的常见方法包括基于人类反馈的强化学习、基于AI反馈的强化学习、有监督的安全微调、专家对抗、遗忘学习、敏感信息过滤、监督监管策略等.安全无小事,内容安全机制可以为生成式人工智能的规模化安全应用保驾护航.
基金项目
中国科技期刊卓越行动计划(WKZB1911BJM501173/02)