故障知识图谱是当前面向装备制造领域的落地重要探索领域,如何通过对设备的运行状态、运行日志进行信息抽取、关系建模,建成可供分析应用的知识库,并支撑故障诊断、维修辅助等应用场景,具有重要意义。

鉴于当前还未有系统性的开源相关项目整理出现,本文为了解决这一问题,从面向装备制造故障领域的知识图谱信息抽取、面向装备制造领域的移动端故障诊断分析平台以及代表性开源信息抽取组件三个方面进行介绍,从抽取评测(用于解决数据标注、定义和业务建模问题)、应用实例(用于解决如何用以及页面长啥样的问题)以及小白如何入门这几个层面进行揭示,供大家一起参考。

一、面向装备制造故障领域的知识图谱信息抽取

1、赛题背景

命名实体识别和关系抽取是知识图谱构建中两项重要的基础任务,自动构建高端装备制造业故障知识图谱对于实现高端装备制造的智能化检修和诊断具有重大意义。各种高端装备领域的故障案例文本是由业务专家或者专业维修人员撰写的描述相关设备异常、以及故障排查步骤的记录,该记录包括故障现象、故障原因、解决方法以及排故过程等,这些故障案例知识的利用受到数据结构化程度的影响,因而识别数据中的部件单元、性能表征、故障状态、故障检测工具等核心实体及其之间的组成关系至关重要。

地址:https://www.datafountain.cn/competitions/584

2、任务定义

本任务为信息抽取中的关系抽取任务,如图所示,带抽取的文本语料为工业制造领域的相关故障案例文本。

1.png

通过从大量故障案例文本抽取出部件单元、性能表征、故障状态、检测工具等实体及其关系,可以为后续高端装备制造业故障知识图谱构建和故障智能检修和实时诊断打下坚实基础。本任务需要从故障案例文本自动抽取4种类型的关系和4种类型的实体。关系类型为:部件单元的故障状态、性能表征的故障状态、部件单元和性能表征的检测工具、部件单元之间的组成关系。具体定义如下:

2.png

3、具体样例

{
"ID": "AT0003",
"text": "故障分析:1.经现场查看整车及动力电池故障灯报警;
2.用上位机查看故障码为总电压欠压二级,单体欠压二级,总压为133.6V,最高单体电压为3.373V,最低单体电压为3.121VSOC为17%初步判定SOC误差较大以及静态压差为265MV;
3.将该车充满电后总压为167.3V,最高单体4.189V,最低单体4.135V,故判断为单体压差过大;
4.当车辆总压为137.7V,SOC17%最高单体电压3.445V,最低单体电压为3.414V时,整车及动力电池故障灯报警,其故障为放电高温一级报警,此时动力电池最高温度为45℃(当天气温31℃,电充满温度为35℃途中路试未休息);
5.持续路试2次放电循环结果如下:①SOC10%总压为138V,最高单体电压3.454V,最低单体电压为3.428V,电池温度41℃、38℃(当天气温32℃路试中下雨,途中未休息)②SOC13%总压为139.5V,最高单体电压为3.493V,最低单体电压为3.459V,电池温度38℃、36℃(当天气温为30℃,分两次路试完成);
6.由于该车为OTS试制车根据以上所检测到的数据,SOC、温度、压差都不在正常范围内,依照现场条件,无法对上述异常情况现场进行排除。", 

"spo_list": [

{"h": {"name": "SOC", "pos": [100, 103]}, "t": {"name": "误差较大", "pos": [103, 107]}, "relation": "部件故障"}, 
{"h": {"name": "总电压", "pos": [37, 40]}, "t": {"name": "欠压二级", "pos": [40, 44]}, "relation": "性能故障"}, 
{"h": {"name": "单体", "pos": [45, 47]}, "t": {"name": "压差过大", "pos": [167, 171]}, "relation": "部件故障"},
{"h": {"name": "车", "pos": [222, 223]}, "t": {"name": "报警", "pos": [231, 233]}, "relation": "部件故障"},
{"h": {"name": "车", "pos": [13, 14]}, "t": {"name": "报警", "pos": [22, 24]}, "relation": "部件故障"}, 
{"h": {"name": "动力电池故障灯", "pos": [224, 231]}, "t": {"name": "报警", "pos": [231, 233]}, "relation": "部件故障"},
{"h": {"name": "动力电池故障灯", "pos": [15, 22]}, "t": {"name": "报警", "pos": [22, 24]}, "relation": "部件故障"},
{"h": {"name": "单体", "pos": [45, 47]}, "t": {"name": "欠压二级", "pos": [47, 51]}, "relation": "部件故障"}]}

延伸项目地址: https://github.com/wgwang/CCL2022

内容中包含的图片若涉及版权问题,请及时与我们联系删除