- 简介尽管社交媒体平台正在付出相当大的努力监控和规范用户生成的内容,但数字空间中仍然存在令人不悦的语言,例如仇恨言论或网络欺凌,这仍然是一个重大挑战。鉴于维护文明和尊重的在线环境的重要性,迫切需要能够实时检测冒犯性言论的自动系统。然而,开发处理中文等语言的有效系统面临着重大挑战,因为该语言的复杂和微妙性使其难以自动处理。本文全面介绍了中文冒犯性语言检测,研究当前的基准和方法,并重点介绍了解决在这种复杂语言中检测冒犯性语言的独特挑战的特定模型和工具。本次调查的主要目标是探索现有技术,并确定可能进一步研究的途径,以解决中文的文化和语言复杂性。
-
- 图表
- 解决问题探讨中文中侮辱性语言检测的挑战以及解决方案
- 关键思路使用深度学习技术,结合中文语言的特点,提出一种有效的侮辱性语言检测模型
- 其它亮点使用了多个中文数据集进行实验,证明了所提出的模型的有效性。同时,提出了一些未来研究的方向,如如何解决文本中的歧义性问题等
- 最近的相关研究包括:《A Survey of Deep Learning for Offensive Language Detection》、《Detecting Offensive Language in Tweets Using Deep Learning》等
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流