共查询到17条相似文献,搜索用时 62 毫秒
1.
2.
线路跳闸作为配电网的一种频发故障,其所积累的大量跳闸填报文本目前主要采用人工处理方式,效率低下且主观因素强。针对这一问题,以构成填报文本因果关系的故障现象及故障原因为挖掘目标,提出一种配电线路跳闸填报文本智能挖掘方法,该方法利用配电跳闸填报文本叙述的逻辑特点,提出了融合分词、词性及句法分析结果的跳闸填报文本抽取策略;在此基础上,提出了一种2阶段筛选方法,首先利用分布式高维向量相似度实现初步筛选,而后基于文本编辑相似度确定文本挖掘最终结果。基于某省的案例分析表明,所提出的文本智能挖掘方法准确率可达72%以上,显著提高了文本处理效率,已能初步满足实际需求。 相似文献
3.
4.
5.
进度控制是水电工程管理的重要任务,及时总结进度管理信息有助于工程进度计划的制定与调整。水电工程建设中的进度信息多以半结构化、非结构化的文本形式呈现,增加了信息提取难度,实现水电工程进度文本信息自动化与智能化挖掘是当前亟待解决的问题。本文提出基于改进LDA的水电工程进度信息智能提取方法,智能提取进度管理文本中的关键信息。该方法基于传统LDA模型针对吉布斯采样机制,充分考虑词语间的关联关系,将原有随机单个采样过程改进为以共现度为基准的词对采样,强化了词语间的语义关联,提高了主题词语间的紧密性以及主题词语对主题描述的准确性。将所提出的方法应用于实际水电工程,对221份水电工程施工监理周报进行分析,共提取12个主题的工序关键词,并依照计算结果提取出主副工序;结果表明,改进LDA主题模型在水电工程进度文本工序特征词提取效果优于传统LDA主题模型,有助于提高工程施工进度关键工序词提取与信息挖掘效率,为水电工程施工智能化管理提供了新的手段。 相似文献
6.
7.
8.
9.
10.
11.
Most of the previous studies focused on enriching text representation to address text classification (TC) task. However, conventional classification approaches with VSM (vector space model) on Chinese text study intensively only the words and their relationship in some specific corpus/dataset but ignore the basic concept of categories and the general knowledge behind the words learned and used to recognize entities by people. This paper focuses on enriching text representation and proposes a novel approach, which complements information from the online Chinese encyclopedia Baidu Baike for Chinese TC. The similarities between every text and each concept of categories and the most related words from Baidu Baike are added to the feature space. The performance of the proposed approach is measured on the Fudan University TC corpus, which is an imbalanced Chinese dataset. In the experiments, the proposed Baidu Baike‐based concept similarity approach obtains promising results when compared with a previous research and the conventional method, with macro‐precision of 90.31%, recall of 75.45%, and F1 score 80.32%, which are about 0.02%, 0.15%, 0.12%, respectively, higher than the conventional method, which obviously improves the recall for some small categories while keeping precision at high level and improving the macro F1 score. Moreover, the proposed approach has good expandability, so that many other knowledge bases could be integrated and many other concepts could be referred to improve the effectiveness. © 2016 Institute of Electrical Engineers of Japan. Published by John Wiley & Sons, Inc. 相似文献
12.
针对水电建设工程的安全管理现状,论述了建立水电建设工程安全性评价系统的意义.提出基于B/S模式的安全性评价系统构架,采用JSP开发技术,开发了包括评价组织管理、评价标准管理等在内的10个功能模块,并分析了其系统特点以及在实际工作中的效果. 相似文献
13.
当前,中国水电开发企业还未能充分地将项目开发过程中所创造和积累的知识进行共享。为了促进水电项目知识共享水平的提高,本文探索了水电项目中知识共享的环境障碍因素及其作用机理。采用半结构化访谈方法,对5个大型水电项目的管理人员进行了调研,通过对访谈案例的定性分析,归纳了水电项目知识共享的五类主要环境障碍因素:组织文化、组织结构、组织制度、项目特征和IT系统,并对这五类因素对知识共享影响的作用机理进行了分析,得出了障碍因素通过影响员工的知识共享意愿、能力和机会,从而影响知识共享行为,并最终影响项目知识共享水平作用机理的结论。最后针对性的提出了促进水电开发企业知识共享的建议。 相似文献
14.
基于LSA的二次降维法在中文法律案情文本分类中的应用 总被引:1,自引:0,他引:1
利用文本挖掘来表达文本特征,由于文本表现出巨大的维数,从而导致处理过程计算复杂,因此,首先应该对文本进行降维处理.潜在语义分析理论(latent semantic analysis,LSA)作为一种文本聚类的方法,在有效提取文本信息表现出许多特有的优势,在多个领域中被引用.本文构建了中文法律案情文本分类系统,引入LSA方法进行文本向量空间的二次降维,并利用LSA方法处理后的特征集--文档矩阵代替原有矩阵,从而进一步删除噪声,加快分类系统的处理速度.文中给出了具体实现过程及实验数据,通过实验证明该方法能收到较好的效果. 相似文献
15.
16.
针对水电站运行管理中大量多源异构的结构化和非结构化文本资料难以有效管理和复用难题,将基于本体的知识建模引入到水电站运维知识管理和知识服务中,定义了基于本体的知识表示模型并详细构建了水电站设备运维、故障预警、应急预案三大典型业务领域本体知识表示实例和本体知识库,提出本体综合相似度计算方法,并以该算法为基础实现了本体驱动的水电站知识检索、预测预警和应急演练可视化应用。通过实际工程案例展示验证了基于本体的水电站运维知识库构建方法及关键技术的可行和有效性,提升水电站知识管理和应用水平。 相似文献
17.
大型水电工程建设过程中面临生产要素流动的复杂性,实物计量的准确性和实效性,以及参建各方管理体系、业务流程、工艺过程的差异性导致的前瞻性与实时性等管理问题。本文依托金沙江下游水电建设,以定位技术、移动应用和物联网等新一代信息化技术为手段,深入开展工程建设与信息化技术的融合研究,集成研发复杂环境下不同定位精度和响应速度的混合叠加定位技术,制定了水电建设各专业标准化工艺流程、管理表格及编码体系,开发移动在线应用系统,研发关键工艺智能技术和设备,构建贯通工程计价全过程的信息系统。项目成果确保了工程建设管理数据全面、真实、准确和实时的获取,实现了人员设备等流动性要素、质量安全等核心业务流程、混凝土浇筑温控及水泥灌浆等关键工艺过程、单元工程计量等真实实物成本在内的工程建设全过程数字化动态管控,促进了业务链、工序链等管理链的整体优化,为智能建造打下了基础,是工程建设智能技术的重要组成部分。 相似文献