首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
文本挖掘是数据挖掘的一个重要分支,其应用前景十分广泛。本文对文本挖掘的基本概念和主要内容进行介绍,并且说明了挖掘的过程以及它的应用领域和它与其他相关领域的关系。  相似文献   

2.
刘蓓  尚银辉  刘绚  安义 《高电压技术》2021,47(2):445-453
线路跳闸作为配电网的一种频发故障,其所积累的大量跳闸填报文本目前主要采用人工处理方式,效率低下且主观因素强。针对这一问题,以构成填报文本因果关系的故障现象及故障原因为挖掘目标,提出一种配电线路跳闸填报文本智能挖掘方法,该方法利用配电跳闸填报文本叙述的逻辑特点,提出了融合分词、词性及句法分析结果的跳闸填报文本抽取策略;在此基础上,提出了一种2阶段筛选方法,首先利用分布式高维向量相似度实现初步筛选,而后基于文本编辑相似度确定文本挖掘最终结果。基于某省的案例分析表明,所提出的文本智能挖掘方法准确率可达72%以上,显著提高了文本处理效率,已能初步满足实际需求。  相似文献   

3.
目前电网企业的电力设备供应商满意度评价主要依赖于人工统计和指标计算,其准确性受评价人员和评价内容的影响较大.以电力业务平台的对话文本为研究对象,在扩充已有电力本体词典的词条和属性的基础上,建立了基于文本挖掘技术的电力设备供应商评价模型.首先提出了基于Transformer的双向编码器下句预测与余弦相似度加权的单轮对话文...  相似文献   

4.
混凝土坝施工信息多以文档文本的形式呈现,其体量大、分布广、内在关系复杂,人工操作难以准确、高效地提取信息知识内容,理清错综复杂的施工信息关系.在自然语言处理技术中,命名实体是文本信息知识的载体,实现精确快速的实体识别是施工知识挖掘的重要前提.本文提出一种融合深度学习与关联规则技术的混凝土坝施工文档知识智能识别及挖掘分析...  相似文献   

5.
进度控制是水电工程管理的重要任务,及时总结进度管理信息有助于工程进度计划的制定与调整。水电工程建设中的进度信息多以半结构化、非结构化的文本形式呈现,增加了信息提取难度,实现水电工程进度文本信息自动化与智能化挖掘是当前亟待解决的问题。本文提出基于改进LDA的水电工程进度信息智能提取方法,智能提取进度管理文本中的关键信息。该方法基于传统LDA模型针对吉布斯采样机制,充分考虑词语间的关联关系,将原有随机单个采样过程改进为以共现度为基准的词对采样,强化了词语间的语义关联,提高了主题词语间的紧密性以及主题词语对主题描述的准确性。将所提出的方法应用于实际水电工程,对221份水电工程施工监理周报进行分析,共提取12个主题的工序关键词,并依照计算结果提取出主副工序;结果表明,改进LDA主题模型在水电工程进度文本工序特征词提取效果优于传统LDA主题模型,有助于提高工程施工进度关键工序词提取与信息挖掘效率,为水电工程施工智能化管理提供了新的手段。  相似文献   

6.
本文针对国内水电开发形势以及数字化技术的发展需求,设计了基于数字流域的梯级水电工程管理系统的总体架构。然后,从技术、方法、理念、资源四个方面提出了系统建设实施原则。最后,结合中国长江三峡集团公司在长江上游和金沙江下游梯级水电工程开发实践,介绍了数字工程、数字移民、数字坝区和数字库区系统的建设内容及取得的成效。实践证明,该系统可供同类流域工程建设和运行管理借鉴。  相似文献   

7.
8.
倒闸操作票的准确性直接影响电力设备与人身安全,现有的出票方法和出票软件存在四大问题,导致操作票出错的情况时有发生.为了解决这些问题,利用操作票规律性强、句式固定、词汇单一等特点,提出了基于文本挖掘的操作票智能校核方法,运用汉语分词与正则表达式技术挖掘历史操作票文本,自动生成校核用的知识库与数据库,进而实现操作票的智能校核.最后,在中山市某变电站的应用实践证明了该方法的有效性和可靠性.  相似文献   

9.
随着电网设备运维的智能化发展,文本作为复杂的非结构化数据如何被有效利用已成为重要的问题。首先利用新词发现和传统分词方法对文本预处理,然后将字词特征映射至多维向量空间,最后基于特征融合构建了注意力机制优化卷积神经网络缺陷文本分类模型。算例分析表明,所提方法比传统深度学习方法提高了分类准确率,有更好的语义学习能力。  相似文献   

10.
随着当前国家电网公司信息化“SG186工程”的深入开展,系统标准、软件规范、业务流程进一步明确。如何做好国家电网公司各业务系统的实施工作,更好地将“SG186工程”的成果服务于全公司信息化发展规划,是当前信息化工作者面临的一项重要任务。基于“SG186工程”项目实施管理的实际经验,提出了在实施管理过程中进行知识挖掘与管理进而建立知识型实施团队的思路,为更好地推动“SG186工程”的顺利开展提供了一种有价值的项目实施管理方案。  相似文献   

11.
Most of the previous studies focused on enriching text representation to address text classification (TC) task. However, conventional classification approaches with VSM (vector space model) on Chinese text study intensively only the words and their relationship in some specific corpus/dataset but ignore the basic concept of categories and the general knowledge behind the words learned and used to recognize entities by people. This paper focuses on enriching text representation and proposes a novel approach, which complements information from the online Chinese encyclopedia Baidu Baike for Chinese TC. The similarities between every text and each concept of categories and the most related words from Baidu Baike are added to the feature space. The performance of the proposed approach is measured on the Fudan University TC corpus, which is an imbalanced Chinese dataset. In the experiments, the proposed Baidu Baike‐based concept similarity approach obtains promising results when compared with a previous research and the conventional method, with macro‐precision of 90.31%, recall of 75.45%, and F1 score 80.32%, which are about 0.02%, 0.15%, 0.12%, respectively, higher than the conventional method, which obviously improves the recall for some small categories while keeping precision at high level and improving the macro F1 score. Moreover, the proposed approach has good expandability, so that many other knowledge bases could be integrated and many other concepts could be referred to improve the effectiveness. © 2016 Institute of Electrical Engineers of Japan. Published by John Wiley & Sons, Inc.  相似文献   

12.
针对水电建设工程的安全管理现状,论述了建立水电建设工程安全性评价系统的意义.提出基于B/S模式的安全性评价系统构架,采用JSP开发技术,开发了包括评价组织管理、评价标准管理等在内的10个功能模块,并分析了其系统特点以及在实际工作中的效果.  相似文献   

13.
何崟  强茂山 《水力发电学报》2012,31(2):265-268,145
当前,中国水电开发企业还未能充分地将项目开发过程中所创造和积累的知识进行共享。为了促进水电项目知识共享水平的提高,本文探索了水电项目中知识共享的环境障碍因素及其作用机理。采用半结构化访谈方法,对5个大型水电项目的管理人员进行了调研,通过对访谈案例的定性分析,归纳了水电项目知识共享的五类主要环境障碍因素:组织文化、组织结构、组织制度、项目特征和IT系统,并对这五类因素对知识共享影响的作用机理进行了分析,得出了障碍因素通过影响员工的知识共享意愿、能力和机会,从而影响知识共享行为,并最终影响项目知识共享水平作用机理的结论。最后针对性的提出了促进水电开发企业知识共享的建议。  相似文献   

14.
基于LSA的二次降维法在中文法律案情文本分类中的应用   总被引:1,自引:0,他引:1  
利用文本挖掘来表达文本特征,由于文本表现出巨大的维数,从而导致处理过程计算复杂,因此,首先应该对文本进行降维处理.潜在语义分析理论(latent semantic analysis,LSA)作为一种文本聚类的方法,在有效提取文本信息表现出许多特有的优势,在多个领域中被引用.本文构建了中文法律案情文本分类系统,引入LSA方法进行文本向量空间的二次降维,并利用LSA方法处理后的特征集--文档矩阵代替原有矩阵,从而进一步删除噪声,加快分类系统的处理速度.文中给出了具体实现过程及实验数据,通过实验证明该方法能收到较好的效果.  相似文献   

15.
日常安全巡检是维护长距离调水工程安全运行的重要手段.目前巡检采集的非结构化文本数据主要依靠人工进行安全等级评判,在工作效率和准确率方面存在明显不足.本研究基于自然语言处理技术,提出了一种面向字符层面的卷积神经网络的巡检安全文本智能分类方法.该方法通过引入预训练的单个字符向量改进卷积神经网络的输入层,使得分类模型直接从原...  相似文献   

16.
针对水电站运行管理中大量多源异构的结构化和非结构化文本资料难以有效管理和复用难题,将基于本体的知识建模引入到水电站运维知识管理和知识服务中,定义了基于本体的知识表示模型并详细构建了水电站设备运维、故障预警、应急预案三大典型业务领域本体知识表示实例和本体知识库,提出本体综合相似度计算方法,并以该算法为基础实现了本体驱动的水电站知识检索、预测预警和应急演练可视化应用。通过实际工程案例展示验证了基于本体的水电站运维知识库构建方法及关键技术的可行和有效性,提升水电站知识管理和应用水平。  相似文献   

17.
大型水电工程建设过程中面临生产要素流动的复杂性,实物计量的准确性和实效性,以及参建各方管理体系、业务流程、工艺过程的差异性导致的前瞻性与实时性等管理问题。本文依托金沙江下游水电建设,以定位技术、移动应用和物联网等新一代信息化技术为手段,深入开展工程建设与信息化技术的融合研究,集成研发复杂环境下不同定位精度和响应速度的混合叠加定位技术,制定了水电建设各专业标准化工艺流程、管理表格及编码体系,开发移动在线应用系统,研发关键工艺智能技术和设备,构建贯通工程计价全过程的信息系统。项目成果确保了工程建设管理数据全面、真实、准确和实时的获取,实现了人员设备等流动性要素、质量安全等核心业务流程、混凝土浇筑温控及水泥灌浆等关键工艺过程、单元工程计量等真实实物成本在内的工程建设全过程数字化动态管控,促进了业务链、工序链等管理链的整体优化,为智能建造打下了基础,是工程建设智能技术的重要组成部分。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号