首页|生成式人工智能内容安全风险分析与安全机制探讨

生成式人工智能内容安全风险分析与安全机制探讨

扫码查看
生成式人工智能对人类生活方式、工作方式乃至认知方式产生了深远影响.未来,AIGC将成为内容生产的主力军之一.通过回顾生成式人工智能大模型的发展和应用情况,总结了当前生成式人工智能面临的法律风险、道德风险、歧视和偏见、虚假信息和模型自身安全风险等相关安全风险,分析了各类安全风险产生的原因,并阐述了生成式人工智能内容安全机制的必要性和重要性.生成式人工智能内容安全机制的常见方法包括基于人类反馈的强化学习、基于AI反馈的强化学习、有监督的安全微调、专家对抗、遗忘学习、敏感信息过滤、监督监管策略等.安全无小事,内容安全机制可以为生成式人工智能的规模化安全应用保驾护航.

张庆国

展开 >

同方知网数字出版技术股份有限公司,北京 100192

生成式人工智能 内容安全 内容安全机制

中国科技期刊卓越行动计划

WKZB1911BJM501173/02

2024

人工智能

人工智能

ISSN:2096-5036
年,卷(期):2024.(2)
  • 20