摘要
价值对齐作为人工智能技术良善发展的有效手段和必经之路,旨在让大模型的能力、行为与人类的真实意图、价值观以及社会道德准则相一致.现有人工智能价值对齐的技术路径和伦理进路虽具备可行性,但存在局限与不足.价值对齐的技术路径缺乏有效性与可拓展性,受限于人类主观偏好,而弱进路价值对齐路径存在"对齐鸿沟"、价值观难以统一和静态价值观等问题,强进路价值对齐路径则存在道德无法化约为一种能力、情感计算技术的困境和多元主体对齐的复杂性等难题.交互式价值对齐路径是实现人工智能价值对齐的有效路径,赋予人工智能交互主体性是价值对齐的前提,情境化价值共识是交互式价值对齐的关键,通过人机合作和社会场景模拟来实现价值对齐.
基金项目
中央高校基本科研业务费专项基金项目(2662023MYQD001)
华中农业大学研究生培养条件建设项目(2023KC06)