安全、负责有道德的对话系统的最新进展：综述

安全、负责有道德的对话系统的最新进展：综述

标题：Recent Advances towards Safe, Responsible, and Moral Dialogue Systems: A Survey

作者：Jiawen Deng, Hao Sun, Zhexin Zhang, Jiale Cheng, Minlie Huang

单位：清华大学人工智能研究所

摘要：

随着人工智能的发展，对话系统被赋予了惊人的聊天能力，产生的内容是否对社会有益也引起了广泛的兴趣和讨论。在本文中，作者提出了一个新的研究范围，以建立一个安全、负责任和情感的对话系统，包括：（1）辱骂和有害的内容，（2）不公平和歧视，（3）伦理道德问题，（4）误导和隐私信息的风险。此外，作者还从暴露和安全问题检测的角度对大模型安全性评估的主流方法进行了综述。

进一步介绍了改进端到端对话系统和基于链路的模型的安全方法方面的最新进展。最后，作者讨论了负责任的人工智能面临的六个挑战：可解释的安全监控、安全问题的持续学习、对恶意攻击的健壮性、多模态信息处理、统一的研究框架和多学科理论集成。作者希望这项调查将启发对更安全的对话系统的进一步研究。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

安全、负责有道德的对话系统的最新进展：综述

评论