首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
本文以涵盖各类单位动态基本信息的全国组织机构代码数据库为基础,依托当前自然语言自动处理技术的成功经验和研究成果,探究实现大规模机构信息自由文本数据的信息抽取、切分词优化、统计分类推断、属性关联分析等方法。为"全国组织机构代码共享平台"实现核心字段动态自动翻译、知识发现、数据质量提高,以及信息自动填补等方面提供关键技术支撑,进而为提高数据库信息利用率提供技术参考,为积极推进国家电子政务信息建设做出有益探索。  相似文献   

2.
汪加婧  范维 《高技术通讯》2021,31(6):660-665
在图像、文本、视频、语音以及社交类网络数据爆炸增长的时代,企业如何从海量非结构化数据中提取出有效信息并将之转化为生产效率的提升和流程自动化的实现,是目前迫切需要关注和解决的问题.本文以运营商集团电子工单自动判责场景为切入点,提出使用基于transformer架构的双向编码器表示(BERT)作为文本分类模型,自动收集各省...  相似文献   

3.
政策文本分类是一项涉及自然语言处理(NLP)、机器学习、政策解析等多领域的综合性技术,在政策管理、研究以及信息服务等方面有重要应用。首先,针对目前政策文本领域公共资源较少的问题,提出结合领域知识和NLP构建政策文本分类数据集的半自动化方法,构建了句子级自然资源政策文本分类数据集;其次,挖掘政策文本自身特点,提出基于深度学习的标题信息自适应增强政策文本分类方法,并在现有主流深度学习模型上进行扩展应用;最后,在自然资源政策文本分类数据集上的实验表明,应用该方法后,5个常用深度学习分类模型的准确率获得了3%以上提升,宏平均F1值获得了5%以上提升。  相似文献   

4.
针对现有图纸文本信息自动提取方法仅能提取单张图纸中的标题栏和明细表内容的情况,提出了一种面向多张CAD(computer aided design,计算机辅助设计)图纸的文本信息自动提取方法,并开发了相应的自动提取与校核系统。采用块表记录迭代器对多张CAD图纸中的所有属性块进行遍历,基于块名筛选得到图纸块及其插入点坐标和幅面,从而确定每张图纸的位置;根据多段线和属性块对多张CAD图纸的文本信息进行属性分类,通过构建窗口选择集来获取图纸中的文本信息并进行提取;利用数组形式输出所提取的文本信息并与原文件进行对比。最后,开发了一套面向多张CAD图纸的文本信息自动提取与校核系统,并通过对连接器电路图文本信息的提取和校核验证了所提出方法和系统的可行性。结果表明,所提出的方法为CAD图纸文本信息的提取提供了新的思路,所开发的系统为企业操作人员提取CAD图纸文本信息提供了新工具,可显著提高工作效率。  相似文献   

5.
随着城市智能化的发展,12345民生服务热线成为广大市民表达诉求的重要渠道之一.民生服务热线所收集的数据蕴含了丰富的当地社会热点,这些文本数据往往具有长度不一、信息量大等特点,而城市诉求管理需要一种高效的分类方法来处理这些热点问题.在此首先阐述文本挖掘中的关键技术,在此基础上研究开发一个针对民生服务热线文本的民生热点挖掘系统,系统主要分为文本预处理、文本智能分类、民生热点挖掘三个功能模块,并借助可视化技术快速准确地分析出群众当前关心的热点,及时处理群众的诉求,使之有助于政府对社会民生建设的管理.  相似文献   

6.
针对传统情感分类算法存在的参数学习困难及分类性能较低等问题,提出了一种基于核超限学习机的中文文本情感分类方法.首先通过信息增益对训练数据进行特征选择以降低输入维数,然后通过构建基于小波核超限学习机的分类器实现对中文文本的情感分类.实验结果表明,新方法参数学习容易,且其文本情感分类性能通常优于支持向量机和朴素贝叶斯.  相似文献   

7.
用户在搜索引擎上进行信息查询时,并不关注返回结果的多少,而是看结果是否和自己的需求吻合。对于一个查询,传统的搜索引擎动辄返回几十万、几百万篇文档,用户不得不在结果中反复筛选。智能搜索技术,采用了先进的"模式识别"方法,可以根据单词或词语的使用和出现频率来识别不同文本在上下文环境中自己产生的模式。通过判断一条非结构化信息中的一种模式优于另一种模式,可使计算机了解一篇文档与某个主题的相关度。利用这种方法,可以抽取文档中的文本要素,自动识别文本的概念然后对该文本进行自动操作。这种创新的高性能模式识别算法提供了精确的文本上下文分析和概念抽取,可对信息自动分类和相互链接,从而提高信息检索的效率。  相似文献   

8.
文本分类技术在搜索引擎中有很重要的用途,本文简要分析了文本分类的评估方法,应用于搜索引擎的分类过程,重点介绍了现行的文本自动分类方法,包括经典算法和新算法以及未来的发展趋势。  相似文献   

9.
周莉 《标准科学》2013,(5):77-81
基于实名制企业质量信用评价技术是搭建以组织机构代码实名制为基础的企业质量信用信息平台的关键技术之一。通过构建企业质量信用评价模型,分析实名制企业质量档案数据,建立实名制企业质量信用评价指标体系,制定实名制企业质量信用等级划分方法,为完善质量信用分类监管机制、推进质量诚信体系建设提供重要技术支撑。  相似文献   

10.
文本分类技术在搜索引擎中有很重要的用途,本文简要分析了文本分类的评估方法,应用于搜索引擎的分类过程,重点介绍了现行的文本自动分类方法,包括经典算法和新算法以及未来的发展趋势.  相似文献   

11.
通过对国内外石油标准体系现状进行分析,确定了石油天然气勘探开发数据标准体系研究技术路线,建立了石油天然气勘探开发数据标准体系结构,并以石油天然气勘探开发元数据标准和石油天然气勘探开发业务分类与编码规则这两项标准为基础,对数据标准和应用标准所包含的数据元元数据、勘探开发业务分类与编码、业务模型、源点信息采集、图形图符、数据交换、图形交换等系列标准进行了阐述。石油天然气勘探开发数据标准体系的建立,为油田企业数据中心建设奠定了基础,为油田勘探开发生产、科研一体化业务协同提供了重要支撑。  相似文献   

12.
工程图文本信息的自动提取与建库技术研究   总被引:1,自引:2,他引:1  
介绍了一个工程图文本信息自动建库系统的设计与实现,系统可自动提取AutoCAD绘制的工程图中的文字信息,实现自动建库和查询,为工程图纸管理系统提供了一种自动、高效的文本信息输入手段。  相似文献   

13.
To find the optimal combination of text modeling for rapid and accurate classification of patent texts and solve the severe problem of manual classification of patent texts in the face of massive patent scientific and technological information. In order to improve the efficiency of patent text automatic classification, the patent texts are split and spliced into 15 different modeling combinations based on the content structure of patent text. Through the 360 comparative experiments, the optimal modeling combination of patent text classification under different classification levels is obtained. The experimental results show that the use of full-text content is not always the best modeling choice in patent classification task. The modeling combination of title, abstract and specification (TAD) is more suitable for patent text classification task. In the subclass level, the highest classification accuracy can be obtained by selecting the specification (d) of patent text. The patent text modeling strategy proposed in this paper provides a good support for improving the effect of patent text classification.  相似文献   

14.
王晨  陈晶晶 《声学技术》2024,43(1):113-118
随着水下自动监测技术的不断发展,对于数据的实时传输效率和测量精度的要求也越来越高,而高质量无损数据压缩传输技术还存在严重不足。文章利用在广西西江航道上建立的侧扫声呐船舶吃水自动监测系统,提出了一种基于目标特征的数据压缩预处理方法。该方法根据散货船的船体结构和声图成像特点,在进行数据压缩前分别在时间和空间两个维度上实现对目标信号的识别和提取,完成对无关冗余数据的剔除。该预处理方法不仅可以大幅提高数据压缩的压缩比,提高传输效率,节省存储空间,还可以保证用于测量计算的目标关键特征信息不丢失,为进一步突破无损数据压缩的压缩比限制提供新思路。  相似文献   

15.
本文以信息化的思维和视角,以业务流程为起点,通过分析现行的气象标准复核业务,给出了其实施信息化的需求和基本原则,提出基于工作流思想的气象标准复核业务系统并设计了系统的关键流程、角色和主要功能,构建一个满足业务运行和过程管理的信息化工作平台。该工作也是一次将业务流程和管理过程与信息技术相集成,统筹业务、管理工作全流程,促进数据资源开发与信息共享的尝试。  相似文献   

16.
17.
张新勤  周睿 《计测技术》2017,37(4):49-52
指针式仪表的自动识别为船舶设备的实时监控和信息化管理提供了有效的技术手段。本文通过计算机视觉技术对指针式表盘自动判读方法进行了研究。实现了对多种指针式仪表的同时识别,识别过程分为表盘分割、刻度识别、指针识别和仪表类型识别等几个部分,运用中心投影法和图集分类比较法等确定了仪表刻度、指针位置和仪表类别,实现了船用指针式仪表示值的自动识别,并通过试验和误差分析验证了识别方法的有效性。  相似文献   

18.
Words are the most indispensable information in human life. It is very important to analyze and understand the meaning of words. Compared with the general visual elements, the text conveys rich and high-level moral information, which enables the computer to better understand the semantic content of the text. With the rapid development of computer technology, great achievements have been made in text information detection and recognition. However, when dealing with text characters in natural scene images, there are still some limitations in the detection and recognition of natural scene images. Because natural scene image has more interference and complexity than text, these factors make the detection and recognition of natural scene image text face many challenges. To solve this problem, a new text detection and recognition method based on depth convolution neural network is proposed for natural scene image in this paper. In text detection, this method obtains high-level visual features from the bottom pixels by ResNet network, and extracts the context features from character sequences by BLSTM layer, then introduce to the idea of faster R-CNN vertical anchor point to find the bounding box of the detected text, which effectively improves the effect of text object detection. In addition, in text recognition task, DenseNet model is used to construct character recognition based on Kares. Finally, the output of Softmax is used to classify each character. Our method can replace the artificially defined features with automatic learning and context-based features. It improves the efficiency and accuracy of recognition, and realizes text detection and recognition of natural scene images. And on the PAC2018 competition platform, the experimental results have achieved good results.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号