首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于粗集理论的中文关键词短语构成规则挖掘   总被引:3,自引:0,他引:3       下载免费PDF全文
短语比词信息量更加丰富,更能够体现原文的主题,通常所说的关键词实际上多数为短语形式.然而目前的问题是关键词短语的自动标引缺乏统一的规则指导.本文利用粗集理论在数据泛化和知识约简方面的优势,对人工标注的人民日报关键词短语语料进行了挖掘,从而得到了中文关键词短语的若干构成规则.规则可以用于自动关键词抽取,也可以对手工关键词标引进行指导.实验结果表明获取的规则使关键词自动抽取的性能有较大改善.  相似文献   

2.
徐志华  周金治  李莲春 《电视技术》2011,35(12):87-89,96
针对下一代网络中海量音视频信息的共享与管理问题,引入UCL(Uniform Content Location)自动标引技术.对网络音视频数据进行多层语义挖掘,制定元数据规范标签.在此基础上,对音视频数据进行识别和分流,深度分析应用层数据,提出了基于UCL技术的网络音视频自动标引方案.编写了模拟仿真软件,在构建的网络音视...  相似文献   

3.
论述了一个图书自动分类专家系统的设计开发过程.通过对图书馆图书分类方式的研究,针对人工分类的不足,基于模糊推理技术及可信度方法,实现了一种较为理想的图书自动分类系统非精确推理,对辅助图书馆编目人员进行文献分类标引工作的图书自动分类专家系统的规划、设计和实现做了探讨性研究.  相似文献   

4.
面向互联网视频的话题分析技术研究   总被引:1,自引:0,他引:1  
本文提出了一种互联网视频话题分析方法,在利用自动网页抓取技术获取的视频信息数据集合基础上,首先利用中文分词技术对视频文本信息进行自动分词,并采用基于不同时间周期的关键词词频过滤算法进行关键词选择,然后采用基于频繁项挖掘的话题聚类方法对热点视频话题进行检测,最后采用贝叶斯分类方法对视频话题进行分类。  相似文献   

5.
基于视频内容的检索方法   总被引:1,自引:0,他引:1  
对于个给定对象的大型集合选择满足某些指定准则的子集是信息检索中的一个中心问题。在传统的视频信息检索手段中最常用的方法是采用本信息来标引媒体对象,并在标引本信息和媒体对象之间建立某种关联,然后将标引信息存入某种传统的关系数据库中,通过这种关系数据库对标引信息的有效的管理和检索操作来达到检索视频信息的目的。这种方法,从逻辑上讲.主要突出本注释信息,重要的实际数据却没有给予足够的考虑。  相似文献   

6.
标引是对内容进行特征提取和标识引导的过程.它的目的是揭示内容特征,便于集中同类的内容,区分不同的内容,为相关内容建立联系。通过标引可提高资源的管理和利用率。标引把对内容的检索,转变为对结构化数据的检索,提高计算机检索的质量。标引可分为自动化标引、半自动化标引和手工标引。  相似文献   

7.
本体的自动构建方法   总被引:1,自引:0,他引:1  
基于本体的信息集成方法是解决语义异构的最有效途径,但是传统的本体构建需要大量的人力物力。借助人工智能技术和WordNet等知识库实现本体的自动构建,将节省大量的社会成本,将是现在以及未来的本体构建方面研究的重点。文中对当今世界上主流的本体自动构建方法进行归纳总结,得出未来本体自动构建技术的主要发展方向。  相似文献   

8.
文化网格中的信息标引及其实现   总被引:2,自引:0,他引:2  
针对文化网格中的信息标引问题,介绍了信息标引的基本理论,提出了基于UCL的标引方案,在局域网环境下进行的缩比实验表明,对网格信息的标引、映射、传输以及有智能代理的下载和存储是必要而可行的.  相似文献   

9.
数字媒体内容标引及映射方法的研究与实现   总被引:1,自引:0,他引:1  
介绍了数字媒体内容标引的设计思想,并对数字媒体内容标引的结构组成及各个组成项所表示的意义进行了说明。同时从信息资源一体化、网络管理语义化、节带传输、科学监管及个性化服务等5个方面分析了数字媒体内容标引技术给传统广播电视带来的巨大意义。最后提出了其内容标引验证系统的组成,并对其关键技术实现进行了分析说明。  相似文献   

10.
图数据关键词查询适用于结构化、半结构化、非结构化数据,使得普通用户在不需要熟悉任何查询语言和底层数据模式情况下能检索数据。目前,图数据关键词查询技术已成为数据库和信息检索领域的研究热点。该文对现有的图数据关键词查询方法进行了综述。首先,介绍了图数据关键词查询的基本概念。然后,对关键技术进行总结和对比分析,包括搜索算法、排序、查询意图和查询评价。最后,对当前工作存在的主要问题及未来研究方向进行讨论。  相似文献   

11.
本文为了提高医生工作效率和分割准确性,寻求一种快速且准确的子宫及子宫肌瘤自动分割方法具有重要的研究意义。本文对近年来子宫及子宫肌瘤MRI图像分割方法进行了总结,包括水平集、区域生长等一些传统分割方法以及最新的深度学习分割方法。最后在文末对子宫及子宫肌瘤分割领域未来的发展方向进行展望。  相似文献   

12.
“高频电子线路”课程内容繁杂、相关性小,学生难以建立课程概念,难以总结教学内容.为了帮助学生总结所学知识,加深对课程的理解,本文对“高频电子线路”的知识点总结方式进行了分析和研究,设计了基于关键词和知识点网络的总结方法,该总结方法有助于提高“高频电子线路”的教学效果.  相似文献   

13.
数据广播中的UCL标引与传输机制   总被引:19,自引:2,他引:19       下载免费PDF全文
马建国  邢玲  李幼平  李在铭 《电子学报》2004,32(10):1621-1624
UCL(Uniform Content Locator)是作者、编者和读者进行语义沟通的工具,是数据广播中解决接收端数据信息的快速选择、信息过滤、智能代理和信息的主动服务的基础.本文系统地介绍了数据广播中UCL的概念,提出了在数据广播中进行UCL标引的方法和两级复用方法,研究了数据广播的UCL-W标引方案,研究了多映射与复用技术,最后给出了在数据广播的传输过程中,发送端对数据信息进行采集、标引、映射、复用、格式转换和调制的工作流程.实验验证了理论方案的正确性和有效性.  相似文献   

14.
关键词组合策略是一种治理垃圾信息(如垃圾短信、垃圾彩信和RCS)的高效手段。当前的治理策略主要依靠人工的方式进行编制和维护,由于需要分析大量垃圾信息,工作量繁重。本文提出了一种基于AI的策略自动生成方法,能够辅助人工进行垃圾信息的分析和关键字组合策略生成,从而大幅减少人力。具体地,本文将垃圾信息中词语按照特定规则进行矩阵化排列,形成关键词矩阵,并输入基于二维卷积神经网络的分类器中进行训练,使得将关键词提取问题转化为在关键词矩阵中进行卷积操作。通过训练分类器,卷积网络能够自动提取出具有显著类别特征的关键字组合特征,在进行任意信息分类的同时,通过提取能够最大化卷积网络激活值的卷积窗口,可以找到针对该信息最合适的关键词组合策略。实验证明,该算法生成的关键字组合策略具有较好的查准率和查全率。  相似文献   

15.
自然语言处理中机器对文本词性标注常用的方法有:基于规则方法、基于统计的方法和基于统计和规则相结合的方法三种。文章对三者用于藏文词性自动标注时在描述方式、标注效率和标注正确率等方面进行了对比研究分析,结果显示基于规则和统计相结合的方法在藏文词性自动标注中具有明显的优势,是目前较理想的方法,此方法用于藏文词性自动标注可以较大地提高正确率。  相似文献   

16.
首先简要介绍了互联网音视频传输监测现状,其次对主动监测技术方案的技术需求进行分析,以互联网音视频传输内容为研究对象提出了基于内容标引的主动监测技术方案,为内容感知和传输监测提供了新的手段.之后较为详细地论证了内容标引及相关关键技术如生成、嵌入与检测等.最后对标引嵌入和检测两个关键环节搭建原型系统进行功能及性能验证.  相似文献   

17.
图像自动标注在检索大量数字图像时起到关键作用,它能将图像的视觉特征转化为图像的标注字信息,为用户的使用及检索带来极大的方便。研究了图像自动语义标注方法,设计并实现了基于Matlab图像自动标注系统,能够提取图像颜色特征和纹理特征,与已标注图像进行相似性度量并标注出图像语义关键词  相似文献   

18.
关键词检出(keywordspottin)g也称词检出(wordspottin)g,是近年来语音识别中颇受重视的研究领域,可广泛应用于电话的自动接听和对话监听、语音的录入和检索等方面。文中首先介绍了关键词检出的HMM方案及其研究成果,并对其进行了仿真实验,最后指出了关键词检出尚待解决的一些问题及研究方向。  相似文献   

19.
对因特网上自动信息提取的研究   总被引:10,自引:0,他引:10  
在对因特网上的数据模型进行研究的基础上 ,作者提出了基于“超链接森林”和“超文本标记加权”的从因特网上全面、准确提取所需信息的方法 ,并考虑了关键词与网页主题的隶属程度。该方法被用于网页的自动分类 ,取得了很好的效果。  相似文献   

20.
基于N-gram统计模型的搜索引擎中文纠错   总被引:1,自引:0,他引:1  
搜索引擎中的关键词纠错是提高检索效率的一项重要辅助功能。提出了一种完全通过分析上下文统计信息的方法,根据中文语言的特点,在建立N—gram统计模型并分析比较的基础上,再通过计算TF/IDF的权重来获得最优的纠错结果,最后通过实验验证了该方法实现了搜索引擎中对输入关键词的自动检查和纠错。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号