CCL-2020系统演示:苏州大学 刘亚慧 陆凯华 李嘉诚 蒋炜 李扬 周明月 杨浩苹 李正华

我们额外建立了一个演示页面,方便提供额外信息,网址为:http://hlt.suda.edu.cn/index.php/CCL-2020-demo

汉语分析平台CUP:包含分词、词性、命名实体识别、句法、语义分析(谓词论元)功能。平台特色包括: · 支持多种分词和词性规范; · 支持高精度多领域句法分析; · 支持弱标注输入、方便模型调试和分析; · 采用目前最先进深度学习技术,统一使用CRF概率模型(ACL-2020; IJCAI-2020)。 网址:http://hlt-la.suda.edu.cn/

数据标注平台SUDAP:支持多分类、层次分类、分词、NER、句法、语义标注。平台特色包括: · 主动学习和局部标注提高效率和质量; · 双人标注、审核、投诉、学习的自动化高质量标注流程。 网址:http://139.224.234.18/anno-sys

汉语开放树库CODT:目前16万句,涵盖约20多个不同领域的文本。数据特点: · 高质量; · 开放数据; · 多领域、多来源。 网址:http://hlt.suda.edu.cn/index.php/CODT

汉语开放谓词论元数据集COPAD:目前3万句、9万多个谓词,涵盖约7种不同来源的文本。数据特点: · 高质量; · 开放数据; · 多领域、多来源; · 语义论元具体到词; · 额外标注了省略的核心论元,以更好地理解句子的语义结构。 网址:http://hlt.suda.edu.cn/index.php/COPAD