生成式人工智能内容安全风险分析与安全机制探讨

张庆国¹

扫码查看

作者信息

1. 同方知网数字出版技术股份有限公司,北京 100192
折叠

摘要

生成式人工智能对人类生活方式、工作方式乃至认知方式产生了深远影响.未来,AIGC将成为内容生产的主力军之一.通过回顾生成式人工智能大模型的发展和应用情况,总结了当前生成式人工智能面临的法律风险、道德风险、歧视和偏见、虚假信息和模型自身安全风险等相关安全风险,分析了各类安全风险产生的原因,并阐述了生成式人工智能内容安全机制的必要性和重要性.生成式人工智能内容安全机制的常见方法包括基于人类反馈的强化学习、基于AI反馈的强化学习、有监督的安全微调、专家对抗、遗忘学习、敏感信息过滤、监督监管策略等.安全无小事,内容安全机制可以为生成式人工智能的规模化安全应用保驾护航.

关键词

生成式人工智能/内容安全/内容安全机制

引用本文复制引用

基金项目

中国科技期刊卓越行动计划(WKZB1911BJM501173/02)

出版年

2024

人工智能

ISSN：2096-5036

参考文献量20

段落导航