首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 609 毫秒
1.
作战数据库文件与记录的文本格式涉及到作战文书的自动生成,文本分类直接关系到情报信息检索效率及准确性。针对军事情报信息的特点,建立了一个基于情报数据库的文本分类模型,然后分析了模型中的文本表示、自动分词、特征提取关键技术,并对互信息特征选取方法提出了改进措施。应用表明,该文本分类模型可有效地从文字信息中分离出规范化的情报要点,不仅辅助作战决策,而且能直接写入数据库。  相似文献   

2.
作战数据库文件与记录的文本格式涉及到作战文书的自动生成,文本分类直接关系到情报信息检索效率及准确性。针对军事情报信息的特点,建立了一个基于情报数据库的文本分类模型,然后分析了模型中的文本表示、自动分词、特征提取关键技术,并对互信息特征选取方法提出了改进措施。应用表明,该文本分类模型可有效地从文字信息中分离出规范化的情报要点,不仅辅助作战决策,而且能直接写入数据库。  相似文献   

3.
谭天晓  赵辉  赵宗涛 《计算机工程》2007,33(14):177-179
信息战中,情报是决定战争成败的关键点之一。针对文本情报,构建了一个基于多Agent的检索模型AIRSM,并结合潜在语义技术,进行用户建模,以满足不同用户的检索需求。实验证明,AIRSM在一定程度上实现了军事情报检索的个性化、智能化。  相似文献   

4.
《微型机与应用》2019,(5):17-21
近年来随着Web3. 0的到来,移动互联网技术得到不断普及,世界已经进入了以数据为中心的时代——大数据智能时代。从大数据量、结构复杂且增长迅速的数据中寻找到有价值的信息和知识并加工成情报,对于决策和风险预警等有重大意义。传统的情报分析方法主要是以人工分析为主,存在着许多不足,分析结果比较片面,难以形象地反映其中的规律性。本系统针对传统情报不能全面把握情报内容的问题,结合自然语言处理的文本相似度分析、情感倾向分析,使用分布式数据库技术作为数据存储的支撑,利用相似度分析、情感倾向分析的技术对情报素材的内容进行全面分析。  相似文献   

5.
基于文本挖掘的可视化竞争情报提取   总被引:6,自引:0,他引:6  
竞争情报的提取需要更自动而高效的工具。本文根据竞争情报的特点,并借助于迅速发展的文本挖掘和信息可视化思想和技术,提出了基于文本挖掘的可视化竞争情报提取系统,并对其中所涉及到的文档收集、文档预处理、文本挖掘和信息可视化等关键技术进行了较为详细的讨论。  相似文献   

6.
杨丰  于广浚  张涛  王强 《计算机应用》2008,28(8):1973-1975
如何有效地传输情报数据是军事情报网格研究的重要问题。将蚁群网格路由算法应用于军事情报网格的传输路径选择,提出一种带删除算子的蚁群网格路由优化算法。在该算法中,通过加入一个称为删除算子的变量,在整个情报传输网格中引入优胜劣汰机制,进行强制淘汰,同时对组合参数进行选择进化,以实现组网路径的有效选择。通过仿真实验证明该算法明显提高情报组网传输性能。  相似文献   

7.
电信大数据中包含了大量的非结构化文本数据,无法通过常规的方法进行信息挖掘,在此情况下文本挖掘可以更好地实现对文本数据的分析挖掘。提出了基于文本的新词识别算法和命名实体识别算法,从而有效地分析用户投诉文本内容并判断其所属类别,并且从用户上网文本信息中识别出其终端型号,为电信行业提供更好的用户支撑和用户体验。最后,对模型的实际应用表明,所提方法对电信投诉文本数据的识别是高效的。  相似文献   

8.
本文基于公安业务中的治安防控原理,构建了面向情报分析和决策指挥的犯罪情报数据挖掘框架.首先,对案事件数据库进行预处理和空间编码的基础上得到标准化的案件信息数据,随后,利用聚类分析、关联分析和分类分析中的相关方法可得到治安案件的时空风险、重点人特征和作案手段特征等信息.通过对北京市实际盗窃案件数据进行挖掘,证明了数据挖掘技术能够很好的应用于犯罪情报的分析.  相似文献   

9.
电子简讯     
日防卫厅将成立“情报总部” 据日本广播协会电台日前报道,日本防卫厅决定成立“情报总部”,以更有效地分析和调用搜集到的军事情报。 报道说,即将开始工作的“情报总部”将囊括分散在陆、海、空三支自卫队中负责搜集和分析军事情报的机构。“情报总部”由监听日本周围国家电台广播的“电波部”、分析美、俄等国人造卫星航空照片的“图像部”和对各种情报进行综合研究的“分析部”组成,共有1500名成员。这家电台说,“情报总部”将把监听到的重要情报报道给内阁总理大臣。  相似文献   

10.
为解决在互联网文本信息爆炸性增长的前提下,在大规模文本数据中如何发现隐含的、有价值的潜在知识的问题,提出基于多层次文本聚类的文本知识挖掘方法,针对不同规模的文本数据进行不同粒度的聚类,实现不同层次知识的挖掘。针对最广义层次的文本知识挖掘可实现各主题事务划分,针对子级分类数据的文本知识挖掘可发现下一层次主题分类,针对自定义层次的文本知识挖掘可发现该事件中存在的具体细节。对诉求实际数据的分析结果表明,该方法可在所有诉求数据中挖掘出各种诉求主题,精确挖掘出其中的细节问题,为管理者提供数据和决策支持,提高服务效率。  相似文献   

11.
军事命名实体识别能够为情报分析、指挥决策等环节提供自动化辅助支持,是提升指挥信息系统智能化程度的关键技术手段。由于中文文化和英文文化的不同,中国语言文字中实体识别第1步是对文章字句进行分词,分词的不准确则会直接造成命名实体识别上的精度损失。此外,一段字句中命名实体的识别是与上下文信息相关的,不同字词对实体识别的贡献度不一定是正向的,多余的字词信息只会对命名实体识别起到负面作用。针对上述挑战,提出了 Lattice长短时记忆神经网络 (LSTM) 结合自注意力机制(self-attention) 的融合网络模型。Lattice-LSTM 结构可以实现对字句中特殊字词的识别,并将深层的字词信息聚合到基于字符的 LSTM-CRF 模型中。Self-attention结构可以发现同一句子中词之间的关系特征或语义特征。使用人工标注的小规模样本集进行实验,结果表明该模型相较于几种基线模型取得了更理想的效果。  相似文献   

12.
软件开发中需要从数据库中读取数据,打印生成word报表,方便对数据的进一步分析研究。简单文本格式无法生成复杂的表格和图形,因而采用WORD作为专用软件的数据报表文件具有重要意义,它可以按照用户要求将数据以图表的形式形象地表示出来。WORD报表的生成利用COM技术,通过C++编程语言访问WORD对象,WORD程序为COM服务器,用户程序为客户端,完成对报表的自动化操作,最终生成Word报表。采用该技术最终生成报表的效率高,很好满足了用户需求。结合实际项目的开发,介绍了WORD报表的生成过程。  相似文献   

13.
随着社交网络的日益普及,基于Twitter文本的情感分析成为近年来的研究热点。Twitter文本中蕴含的情感倾向对于挖掘用户需求和对重大事件的预测具有重要意义。但由于Twitter文本短小和用户自身行为存在随意性等特点,再加之现有的情感分类方法大都基于手工制作的文本特征,难以挖掘文本中隐含的深层语义特征,因此难以提高情感分类性能。本文提出了一种基于卷积神经网络的Twitter文本情感分类模型。该模型利用word2vec方法初始化文本词向量,并采用CNN模型学习文本中的深层语义信息,从而挖掘Twitter文本的情感倾向。实验结果表明,采用该模型能够取得82.3%的召回率,比传统分类方法的分类性能有显著提高。  相似文献   

14.
贵州省非物质文化遗产极为丰富,蕴涵着贵州各民族特有的精神价值、思维方式、想象力和文化意识,体现着贵州各民族的生命力和创造力。为了更好地发掘和保护贵州非物质文化遗产,通过对贵州省非物质文化遗产保护中心网的数据挖掘,采用词云分析、聚类分析和可视化技术等,对贵州非物质文化遗产的文本数据进行处理,并提取有价值的关键文本信息,为贵州非物质文化遗产的传承和发展提供依据。  相似文献   

15.
直接利用主题模型对地质文本进行聚类时会出现主题准确性低、主题关键词连续性差等问题, 本文采取了相关改进方法. 首先在分词阶段采用基于词频统计的重复词串提取算法, 保留地质专业名词以准确提取文本主题, 同时减少冗余词串数量节约内存花销, 提升保留词的提取效率. 另外, 使用基于TF-IDF和词向量的文本数据增强算法, 对原始分词语料进行处理以强化文本主题特征. 之后该算法与主题模型相结合在处理后的语料上提取语料主题. 由于模型的先验信息得到增强, 故性能得以提高. 实验结果表明本文算法与LDA模型相结合的方法表现较好, 在相关指标及输出结果上均优于其他方法.  相似文献   

16.
刘伯鸿  孙浩洋 《测控技术》2020,39(10):32-36
针对轨道电路不均衡的故障历史文本数据,提出了一种针对非均衡历史文本数据挖掘的轨道电路智能分类模型。选取TF-IDF和先验LDA无监督机器学习模型对历史故障文本数据分别进行词项级和主题级故障特征提取并向量化,将提取的历史数据特征向量串行融合,得到其特征向量空间。采用SMOTE算法自动生成历史文本数据中的少数类数据,避免在机器学习过程中出现欠拟合现象。鉴于单个分类器在机器学习及智能分类的精度不高,采用投票的方式实现基分类器与集成分类器的集成学习。选择广铁集团电务段2011年的故障文本数据进行试验分析,验证该模型在历史故障数据分类的准确率和召回率等方面的优势。  相似文献   

17.
随着社交网络平台的广泛使用,涌现出大量蕴涵丰富情感信息的在线评论文本,分析评论中表达的情感对企业、平台等具有重要意义。为了解决目前针对在线评论短文本情感分析中存在特征提取能力弱以及忽略短文本本身情感信息的问题,提出一种基于文本情感值加权融合字词向量表示的模型——SVW-BERT模型。首先,基于字、词级别向量融合表示文本向量,最大程度获取语义表征,同时考虑副词、否定词、感叹句及疑问句对文本情感的影响,通过权值计算得到文本的情感值,构建情感值加权融合字词向量的中文短文本情感分析模型。通过网络平台在线评论数据集对模型的可行性和优越性进行验证。实验结果表明,字词向量融合特征提取语义的能力更强,同时情感值加权句向量考虑了文本本身蕴涵的情感信息,达到了提升情感分类能力的效果。  相似文献   

18.
分析和研究文本读者情绪有助于发现互联网的负面信息,是舆情监控的重要组成部分。考虑到引起读者不同情绪主要因素在于文本的语义内容,如何抽取文本语义特征因此成为一个重要问题。针对这一问题,提出首先使用word2vec模型对文本进行初始的语义表达;在此基础上结合各个情绪类别分别构建有代表性的语义词簇,进而采用一定准则筛选对类别判断有效的词簇,从而将传统的文本词向量表达改进为语义词簇上的向量表达;最后使用多标签分类方法进行情绪标签的学习和分类。实验结果表明,该方法相对于现有的代表性方法来说能够获得更好的精度和稳定性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号