首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
本文对信息过滤中的关键技术不良信息识别方法进行了研究,提出了一个基于内容的不良信息过滤模型,并结合现有的分类方法,给出了几种适用于不良信息文本实时识别的方法,对各算法用于不良信息识别的原理进行了描述.  相似文献   

2.
针对网络不良文本信息的过滤问题提出了一种基于文本倾向性的不良文本识别方法.首先采用基于主题的文本分类方法,然后对不良主题的相关文本利用倾向性分析方法识别不良文本.基于文本倾向性由文本主题词的上下文词汇确定的假设,提出了一种基于主题词上下文的文本倾向性分类方法.实验结果显示该方法对已有基于主题分类方法很难区分的文本具有较好识别效果.  相似文献   

3.
实时文本分类系统的研究与实现   总被引:5,自引:1,他引:4  
分析文本分类过程中影响实时性的因素,即分词处理高耗时和特征空间维数过高问题。结合网页过滤的实时应用提出一种实时文本分类方法,弱化分词处理过程,降低特征空间维数,以提高分类速度。通过优化特征项选取维持分类效果,基于贝叶斯理论实现实时文本分类系统。实验结果表明,该方法在维持精确率和召回率分别为85%, 94%的情况下,显著提高了分类速度。  相似文献   

4.
根据视频相机拍摄的多种画面进行识别是一个具有挑战性的研究课题。由于相机可以记录并利用画面之间的覆盖区域来改善文本图像的质量,以识别文本中较长的线段。在相机抖动产生的失真得到补偿之后,视频画面就应该被记录,如拼接。本文提出了一种拼接识别技术来描述视频拼接和文本识别,同时,通过基于程序的最佳算法使问题得到解决。实验显示,当画面受到各种失真,如旋转、按比例描述、转换以及非线性相机运动速率波动时,本文的方法可以获取良好的拼接图像,其失真的精确评估达到90%,字符识别的正确率超过95%。  相似文献   

5.
KNN算法是一个常用的分类算法,具有简单易实现等优点,在数据挖掘、机器学习和模式识别等领域被广泛使用.研究了KNN算法,设计并实现了一个用于自然语言处理领域的基于KNN算法的文本分类器,分别用国际通用的语料库和实际项目的数据集进行测试,两份测试结果差异较大,初步分析了导致这种差异性的原因,讨论了下一步需要改进的地方.  相似文献   

6.
7.
在语种识别中,传统的N-Gram方法对文本长度依赖度高,因而无法有效地对短文本进行语种识别。现有的基于神经网络的模型无法同时考虑词本身信息和词间组合信息,从而降低了短文本语种识别的质量。针对以上问题,提出一种基于深度学习的字符级短文本语种识别方法。采用卷积神经网络从字符向量中获取词中字符组合信息;通过长短期记忆网络获取词与词之间的特征信息;使用全连接网络实现相似语言的语种识别。在维吾尔语、哈萨克语以及DSL2017数据集上的实验结果表明,该方法可以有效地提高相似语言短文本的识别精度。  相似文献   

8.
《软件工程师》2015,(12):54-56
信息系统在经济活动和社会活动中的地位和作用越来越重要,信息安全问题成为不可忽视的问题,数据加密能有效防止数据库中敏感数据泄漏。Oracle数据库透明数据加密(TDE)使用主密钥和表密钥对敏感数据字段进行加解密。本文结合"煤粉燃烧特性管理信息系统"项目开发,使用透明数据加密(TDE)对敏感数据字段进行了加密应用研究。  相似文献   

9.
基于FIFA算法的文本分类   总被引:9,自引:0,他引:9  
本文提出了一种简单有效的文本分类方法,其中采用基于FIFA算法的内容主题分析技术,实现文本的自动分类过程。文中详细论述了文本自动分类的基本过程和FIFA算法描述,最后给出了文本自动分类的实验结果和评价。  相似文献   

10.
为了有效地保护各种数字化产品的版权,防止产品被篡改,假冒和盗用,提出一种新的数字产品版权保护技术即数字水印.针对目前数字水印技术的研究主要集中在图像、视频和音频等方面的现象,分析了几种常用的文本数字水印技术,并按各自不同的嵌入方法对它们进行归类,设计并实现了一种基于文本内容的文本数字水印算法,利用中英文逗号的替换完成水印的嵌入与提取.测试结果表明了该算法的可行性,并分析了算法的鲁棒性、隐蔽性及水印容量.  相似文献   

11.
在足球赛事视频的应用背景下,分析了面向视频场景内容检索的文本解析关键技术,设计并实现了面向视频场景内容检索的文本解析工具。该工具利用中文分词技术分割自然语言文本,通过汉语语法规则提取关键词,采用加权算法对关键词排序,并将关键词映射到知识表达集,从而获得关键词的语义信息,完成文本解析。实验结果表明,该工具能够满足自然语言文本的视频检索需求。  相似文献   

12.
文本倾向性识别可以广泛应用于用户产品评论、舆情分析等。针对文本倾向性识别往往需要借助外部资源的问题,提出一种基于情感描述项及改进的互信息计算相结合的方法,通过句法分析提取出若干可以获得文本情感描述项的匹配模式,根据模式匹配及计算情感描述项的互信息作为特征值,训练分类模型得出文本的褒贬性。通过对酒店、手机语料集实验后的结果进行分析,该方法具有良好的效果。  相似文献   

13.
针对自然语言处理领域生成式文本摘要任务中存在的语义编码不充分、摘要语句不通顺问题,提出一种基于序列到序列(Seq2Seq)结构的生成式摘要模型TCAtten-GRU.采用双编码器对源文信息进行充分编码,应用时间卷积网络(TCN)获取全文的语义信息,卷积神经网络(CNN)提取文本的高层特征.解码器采用结合指针机制和集束搜...  相似文献   

14.
为减轻台风灾害风险,辅助开展台风风险防控,基于 1974—2019 年台风路径、风力和降雨等数据对我国台风危险性进行分析。将我国划分为多个地理网格,采用分布式数据库 Hbase 构建网格、台风和影响分值列簇,基于网格对历史台风路径及风力、降雨再分析数据进行预处理,建立台风影响范围拟合和影响力衰减等函数,利用分布式计算引擎 MapReduce 计算台风对各网格造成的影响力分值,并计算不同年份、年段台风危险性。结果表明:1)本方法数据依赖性较低,计算效率较高,评估结果更客观,推广性较强;2)研究过程中采用归一化法对危险性进行分级,导致不同时间段评估结果出现较大差异,须进一步研究改进;3)我国台风危险区总体呈现为极高、高、中、低 4 条危险带,台风危险性呈现增强趋势,并持续向东北、中西部延伸,未来防台风形势依然严峻。  相似文献   

15.
针对传统地理信息系统(GIS)结构化或半结构化属性查询方法对查询语句输入的精度及查询范围的限制,提出了以哈尔滨工业大学《同义词词林》扩展版文本相关度计算为核心的非结构化文本数据GIS描述性查询方法。基本过程是根据描述性查询语句计算其与地理要素所关联的文本的相关度,进而以相关度值得出概括性查询结果。对比实验结果表明,描述性查询方法不但支持查询语句输入的多样化,而且能够有效地得出与输入的描述性查询相关联的地理要素。  相似文献   

16.
交互式电子技术手册是综合保障领域的一次技术革命,在分析非结构化数据和结构化数据分类的基础上,采取非结构化数据-XML-结构化数据的转换方式,将非结构化技术资料的元数据信息转换为可存储在公共源数据库(CSDB)中的结构化数据,为IETM数据录入问题提供解决方法。  相似文献   

17.
自适应系统识别是通过测量系统输出信号利用自适应滤波器建立模型的一种重要方法。本文论述了基于LMS算法自适应FIR滤波器的实现原理,及其在系统识别中的应用。并通过计算机的仿真实现,详细阐述了其在定点DSP上的实现方法。  相似文献   

18.
顾昕  张兴亮  王超  陈思媛  方正 《计算机应用》2014,(Z2):280-282,313
为了提高图像检索的效率,提出一种基于文本和内容的图像检索算法。该算法采用稠密的尺度不变特征转换( DSIFT)构造视觉单词的方式来描述图像内容,依据基于概率潜在语义分析( PLSA)模型的图像自动标注方法获取的视觉语义对查询图像进行初步检索,在此结果集上对筛选出的语义相关图像按内容相似度排序输出。在数据集Corel1000上的实验结果表明,该算法能够实现有效的图像检索,检索效率优于单一的基于内容的图像检索算法。  相似文献   

19.
目前主流的网页抽取方法存在两大问题:提取信息类型单一,难以获取多种类新闻信息;多依赖HTML标签,难以扩展至不同来源。为此提出一种基于多维度文本特征的新闻网页信息提取方法,利用新闻文本的写作特点划分出写作、语义和位置特征,通过多通道卷积神经网络融合为多维度文本特征,用于提取多种类新闻网页信息;仅需少量数据集训练,就可提取新来源的新闻网页信息。实验结果表明,该方法在性能上高于当前最优方法。  相似文献   

20.
《微型机与应用》2017,(19):19-22
传统的LDA主题模型没有考虑词频对主题分类的影响,使得主题分布向高频词倾斜。为了综合考虑词频和主题间的相关性,文中利用互信息能够表达变量间相关性的特点,在互信息基础上改进作为特征选择方法,利用评价函数评价特征词的权重值改进LDA算法分类过程,提高对主题分类贡献度高的特征词的作用。通过在新闻语料库上的分类实验证明了该方法的有效性,同时表明分类的准确率也有所提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号