摘 要: | 化学品危险评估与人民生命财产安全密切相关,化学品信息的运用直接影响危险评估的快捷程度和准确度。建立化学品危险评估知识图谱能有限管理和应用化学品信息。本文对化学品危险评估领域知识进行了梳理,在确定了领域范围、知识内容和基本本体层次关系基础上,提出了一种准确高效的领域知识构建方法—"NLP及人工智能辅助法":首先,利用爬虫技术对数据进行采集和清洗通过数据抓取及数据清洗;从获得7.8亿条结构化数据中利用中文分词、语义分析等技术进行了知识抽取,构建化学品危险评估知识主体层次关系;通过关系映射、语义分析等技术手段抽取本体属性;基于自然语言处理和人工智能技术苟安知识本体及知识图谱。本研究在一定程度解决了化学品评估知识图谱专业性强、数据量大、过程复杂;中文知识图谱构建的开放链接相对缺乏,导致目前国内尚没有成熟的化学品评估中文知识图谱的问题。化学品危险分类信息匹配为场景实现了初步应用,结果表明,化学品危险评估知识图谱在危险分类信息数据查询、匹配验证的应用将人工平均时间从4460秒压缩到137秒,准确率从86.2%提升到94.3%,大幅提高了化学品危险评估数据查询和匹配的效率。本文的工作进一步表明利用知识图谱可以更好的实现行业或专业领域知识的管理,具有重要应用价值。
|