首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
在历史网页检索系统中,存在着按时间顺序来对检索结果进行排序的特殊需求,在客观上要求系统能够比较准确地判断文档与查询词是否相关。针对这一特殊需求,引入领域的概念,将领域用于用户检索的表示,在领域的基础上设计了一种带衰减因子的BM25检索相关性计算算法。实验结果显示该检索算法是有效的,引入领域后检索结果的F值平均提高了56.68%。  相似文献   

2.
针对大数据时代,各业务评论数据的增长速度前所未有,阅读耗时且难以把握关键内容,数据普遍存在杂乱无章、内容量大以及价值信息难提取等问题。因此,提出基于评论数据的文本关键词提取和可视化方法。通过网络数据爬虫技术采集商业旅游网站景点评论数据,从Pythonjieba分词工具包里导入文本提取功能,再采用TextRank算法对景点评价词汇进行处理,提取热度关键词和权重值,最后经Echarts图进行展示,形成词云图,通过看图直接掌握文本重要内容,可节省大量的阅读时间。  相似文献   

3.
为能够在一段视频中检索特定事件,提出一种基于深度学习的视频语义检索方法,使用你只看一次(You Only Look Once,YOLO)模型检测视频中的对象,通过聚类分析提取对象的语义轨迹,结合检索到的对象与语义轨迹实现特定事件的视频语义检索功能。实验结果表明,该方法能够满足应用要求。  相似文献   

4.
用户通过检索平台能获得大量信息,但搜索结果往往会出现主题漂移、偏重旧网页的现象,不能满足用户实际需求.为改善这种现象,提出了一种改进的PageRank算法.该算法采用BM25相似度算法对主题相似度进行计算,根据相似度评分来赋予不同的影响权重,可以提相似度高的网页的排名;利用网页在搜索引擎周期内被搜索到的次数来表示网页存...  相似文献   

5.
6.
为了解决文档与查询之间词的不匹配的问题,对问题扩展技术进行了研究,提出了一种基于维基百科的查询扩展方法.该方法使用与问题相关的维基百科页面对问题扩展,引入了基于局部文档集的查询扩展方法,并使用BM25算法对检索排序进行修正.通过测评对比,验证了用此方法得到的检索结果在原来的基础上有了很大提高.  相似文献   

7.
随着网络的迅速发展,网络安全问题日益突出,入侵检测技术的应用越来越广泛,对Snort入侵检测系统来说,模式匹配算法仍是其使用最多的基本算法,模式匹配算法的效率直接影响到入侵检测系统的性能。该文介绍了KMP和BM算法,并对其进行了比较,并对BM算法的进行了改进,提高了模式匹配的速度。  相似文献   

8.
9.
针对维吾尔语文本的分类问题,提出一种基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类方法。首先,对输入文本进行预处理,滤除非维吾尔语的字符和停用词;然后,利用词语语义相似度、词语位置和词频重要性加权的TextRank算法提取文本关键词集合;最后,根据互信息相似度度量,计算输入文本关键词集和各类关键词集的相似度,最终实现文本的分类。实验结果表明,该方案能够 提取出具有较高识别度的关键词,当关键词集大小为1250时,平均分类率达到了91.2%。  相似文献   

10.
在足球赛事视频的应用背景下,分析了面向视频场景内容检索的文本解析关键技术,设计并实现了面向视频场景内容检索的文本解析工具。该工具利用中文分词技术分割自然语言文本,通过汉语语法规则提取关键词,采用加权算法对关键词排序,并将关键词映射到知识表达集,从而获得关键词的语义信息,完成文本解析。实验结果表明,该工具能够满足自然语言文本的视频检索需求。  相似文献   

11.
12.
FastText是一种准确高效的文本分类模型,但直接应用在中文长文本分类领域存在准确度不高的问题.针对该问题,提出一种融合TextRank关键子句提取和词频-逆文本频率(Term Frequency-Inverse Document Frequency,TF-IDF)的FastText中文长文本分类方法.该方法在FastText模型输入阶段使用TextRank算法提取文本的关键子句输入训练模型,同时采用TF-IDF提取文本的关键词作为特征补充,从而在减少训练语料的同时尽可能保留文本分类的关键特征.实验结果表明,此文本分类方法在数据集上准确率达到86.1%,比经典的FastText模型提高了约4%.  相似文献   

13.
根据视频相机拍摄的多种画面进行识别是一个具有挑战性的研究课题。由于相机可以记录并利用画面之间的覆盖区域来改善文本图像的质量,以识别文本中较长的线段。在相机抖动产生的失真得到补偿之后,视频画面就应该被记录,如拼接。本文提出了一种拼接识别技术来描述视频拼接和文本识别,同时,通过基于程序的最佳算法使问题得到解决。实验显示,当画面受到各种失真,如旋转、按比例描述、转换以及非线性相机运动速率波动时,本文的方法可以获取良好的拼接图像,其失真的精确评估达到90%,字符识别的正确率超过95%。  相似文献   

14.
深度学习由于其强大的特征表示能力在图像处理、语音识别、推荐系统能领域取得了重大进展.论文提出了一种基于深度学习的针对视频对特定人进行检索的方法,该方法综合使用了MTCNN的人脸检测与对齐以及FaceNet的人脸识别功能,同时论文针对视频连续性的特点,对检索结果进行了特殊处理,实验结果表明论文方法具有较高的准确率和较快的...  相似文献   

15.
随着网络和多媒体技术的发展,越来越多的视频数据充斥着互联网,对视频进行有效的管理,尽可能排除其中的重复内容已经成为一项很重要的工作。基于这种现状,设计了一套快速而有效的视频近似拷贝检索系统。不同于传统的视频近似检测方法,该系统采用深度学习的方法,使用深度卷积神经网络快速地为采样帧提取特征,使用k-d树为视频库中的特征值建立索引,从而提高相似查找的速度,最后计算输入视频与所有候选视频的相似度,并按相似度对候选视频排序输出。  相似文献   

16.
网络视频信息数量虽有井喷式增长,但是利用率依旧不高。加之大多农村地区信息化程度依旧滞后,造成农产品信息的严重不对称,严重阻碍了农村特色农产品的推广。本文通过分析中国网络视频市场的发展历程,对中国现有的视频推送模式进行研究,提出基于特色农产品的视频智能推送模式,并对视频智能推送系统中的技术难点及实现步骤进行了详细阐述。  相似文献   

17.
AntConc3.2.4是一款免费的语料库检索工具,适用于语言学、翻译学、文学研究和外语教学等领域。它可以根据使用者的需要,对文本中的词汇和句子进行有效的检索和统计,为进一步的文本分析提供支持,在语言学习方面具有广阔的应用前景。选取石油技术英语文本作为研究语料库以及其他类型的英语文本作为参照语料库,并利用该软件对两个语料库进行分析,具体从石油技术英语的检索结果出发,分析石油技术英语中词汇的特点,帮助该领域的学习者快速掌握石油英语的核心词汇和特点。  相似文献   

18.
基于内容检索的视频处理技术   总被引:32,自引:1,他引:31       下载免费PDF全文
从分析视频数据的结构和特点出发,总结了基于内容检索的视频处理方法的一般步骤,即视频分割、关键帧选取、静态和动态特征提取以及视频聚类等,然后深入介绍了各个处理过程中的一些最新方法,并分析了各种方法和技术的优缺点;最后,对基于内容的视频检索提出一些值得进一步研究的问题。  相似文献   

19.
《软件》2019,(7):47-51
如何更方便快速地获取到准确的信息是众多专家学者研究的课题。立足于微信小程序与手机客户端平台,智能问答系统从总体的设计出发,到知识库的构建,通过对自然语言处理,借用改进的TF-IDF算法提取关键字特征,BM25算法计算语素权值,以达到精确快速匹配到最佳答案的目的,从而解决问题。初步测试证明,该系统具有良好的实用性,稳定性和可拓展性。  相似文献   

20.
作为一种经典的文本关键字提取和自动生成算法,TextRank将文本看作若干单词组成的集合,并通过对单词节点图的节点权值进行迭代计算,挖掘单词之间的潜在语义关系。在TextRank节点图模型的基础上,将马尔可夫状态转移模型与节点图相结合,提出节点间边权为条件概率的新模型生成算法TextRank_Revised。通过对有标记和无标记的验证集进行验证,证明新的算法在不提升时间复杂度的前提下,通过计算单文本得出的单词排序结果相较于原TextRank算法更加吻合人工对文档的关键字提取结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号