首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
无标引题检索系统的实现是针对目前计算机题录标引、检索中存在的一些难以克服的困难,结合计算机硬件系统的不断发展所作的一次实验性尝试。随着现代计算机技术的不断发展和完善,计算机的内存容量不断扩大,成本不断下降。本系统充分利用这种优势,把所有数据一次性调入扩展内存,对数据的检索仅在内存中进行,避免了反复访问磁盘,从而提高检索速度。本系统还充分利用Borland C++的优势,采用面向对象程序设计工具Tu  相似文献   

2.
针对微博文本的特点,提出了一种自动识别微博标引词的方法。根据微博文本中的名词或动词之间语义相似度构造图的邻接矩阵,在图的邻接矩阵基础上利用Pagerank算法思想来计算词语的重要度,选择重要度较大的一些词作为标引词。实验结果表明,较传统的自动标引方法,提出的自动标引方法简单实用、准确率较高。  相似文献   

3.
《软件》2017,(9):117-121
在信息化时代,高效地组织管理大量地质领域数据成为实现良好的地质资料服务与管理的关键所在。为解决我国地质资料标准化程度低及应用难度大等问题,本文提出了一种基于本体和语义标引的地质资料服务与管理方法。首先建立地质领域信息资源元数据模型和关联关系模型;并根据关联模型自动化构建计算机可读的地质本体;采用基于地质本体的语义概念映射的方法将高维的词语向量转换到低维语义空间,加之词频、词位置和词跨度等权重因子的综合作用,对地质资料文本进行精准快速有效的分类,实现文本的语义标引;最后根据地质本体和语义标引开展地质资料检索试验,试验结果表明,查全率和查准率分别从75.7%和81.2%提高到80.7%和84.8%,检索效果得到了明显提升。因此,本文为地质资料的服务与管理模型设计与实现奠定了良好的基础。  相似文献   

4.
本文介绍了多种文献自动标引中外文情报检索微机系统(简称DZQJ)的设计思想和功能特点。作者从“部件词典法”思想出发,做了进一步的试验和改进。较好地实现了对汉、英等文字的文献正名和并列名自动抽取关键词建立索引的自动标引功能。遵循国家有关文献录著标准和规则设计了各类文献输入输出格式。DZQJ系统具有包括四大检索途径在内的多种检索查找途径。研制中考虑了方便手工检索等问题。  相似文献   

5.
自动标引是基于内容检索的关键技术之一。目前国内的汉语自动标引研究主要集中于汉语自动分词这个前期处理问题上。提出了一种基于词平台的汉字编码方法,建立了一种新的中文计算机文档表达格式,使词成为最小的信息单位,汉语分析无需再进行自动分词,可直接进行自动标引,从而提高自动标引的效率和质量。  相似文献   

6.
自动标引中中文姓名的切分   总被引:2,自引:2,他引:2  
靳从  唐振民  杨静宇 《计算机工程》2003,29(22):153-154
主题词的分割是计算机自动标引的第1步,由于中文姓名不像英文、欧洲语言那样可以通过大写字母来辨别,这就给姓名的识别带来一定的困难。该文根据自动标引系统的要求,充分利用姓名的特点及相关信息,给出了一个基于姓名基本结构的切分方法。通过系统标引结果证明了方法的可行性。  相似文献   

7.
中文信息的标引是国内信息导航系统实现的基础,汉语分词和语义提取是目前尚未解决的难题。本文比较了信息检索系统中目前主要使用的标引方法,根据国内信息导航系统处理对象的“中文”特征,提出了关键词标引与全文标引相结合的混合标引方法,并给出了具体的实现方法,较好地解决了查全、查准和标引空间的增长问题。文中最后也给出了中文信息标引处理后入库的数据的检索方法。  相似文献   

8.
一类规范文本篇章结构的自动标引   总被引:2,自引:1,他引:2  
本文通过对汉语文本中标题和段的级、标题的型等概念的描述与分析,讨论了汉语文本篇章结构的标引问题,提出了规范文本的概念,并给出了规范文本篇章结构的一种标记方法,在此基础上,讨论并实现了规范文本篇章结构的自动标引,给出了标引算法。  相似文献   

9.
基于语义网技术的主题词自动标引   总被引:1,自引:0,他引:1  
为了实现电子政务公文主题词语义意义上的自动标引,创建了电子政务领域的概念空间,包括使用主题词表本体形式描述基本的概念及其关系和使用语义网资源描述框架表示概念类别词及其关系,然后根据主题词表抽取出题名所包含的主题词,并消除歧义词,最后将所得到的主题词使用逻辑推理机RACER进行语义逻辑的推理,从语义的角度进行主题词标引,突破机械标引的局限。  相似文献   

10.
关键词自动标引的最大熵模型应用研究   总被引:37,自引:0,他引:37  
关键词是文档管理、文本聚类/分类、信息检索等领域可利用的重要资源,因此该文提出了利用最大熵模型进行自动标引的技术.最大熵模型为一个成熟的数学模型,已经应用到计算语言学的各个领域.然而它的应用非常灵活,针对标引任务和现有资源的实际情况,作者首先建立了最大熵模型的特征集合,然后提出了三种试验方法,并给出了相应的试验结果,最后针对最大熵模型在关键词自动标引任务中的应用做了有益的分析和探讨.该研究对于关键词标引研究以及最大熵在其他领域中的应用将有所启示.  相似文献   

11.
基于UCL的网页自动标引技术   总被引:5,自引:0,他引:5  
UCL(UniformContentLocator)是作者、编者和读者进行语义沟通的工具,是进行信息快速选择、智能代理和信息主动服务的基础。该文针对网络信息检索中的自动标引问题,提出了一种基于UCL的网页自动标引技术。研究了从HTML编写的网页映射到XML文档的过程,并从中提取符合用户兴趣模型的UCL字段,从而达到网页自动标引的目的。实验验证了理论方案的正确性和有效性。  相似文献   

12.
基于篇章结构的文本自动标引算法   总被引:3,自引:0,他引:3  
通过对输入文本分析,划分文本的篇章结构,分为依次存在包含关系的全文章节、段落、复句、分句五个层次,用文本结构树来表示.给出了标记方法,并在此基础上讨论并实现了文本篇章结构的自动标引,提出了两个标引算法并给出了比较结果,为自动文摘后续工作给予了很大帮助.  相似文献   

13.
1 机器翻译的沿革机器翻译(MT)的历史是曲折而饶趣的。计算机刚一发明,就有人想到用它来进行自然语言的翻译。1949年美国人Weaver的著名备忘录第一次点燃了人们对MT的热情。  相似文献   

14.
15.
基于中文题名的计算机辅助标引   总被引:1,自引:0,他引:1  
本文阐述了基于中文文献题名的计算机辅助标引系统的组成结构,并讨论了其中的一些关键技术问题,文章从系统结构设计方面,对该系统的建表模块,目录模块,分词标模块,校对模块,选号打印模块和系统管理模块进行了讨论,并着重讨论了分词标引技术。  相似文献   

16.
基于后控技术的中小型竞争情报系统自动标引研究   总被引:2,自引:0,他引:2  
为企业设计构建竞争情报系统对支持企业做出适时恰当的决策起着重要作用.基于此.为中小企业设计了一种基于Internet的竞争情报系统,为企业提供智能检索、个性化的服务等;为了提高系统的检索效率,改善系统功能,通过分析后控词表与本体之间的关系,提出一种利用本体编制后控词表的方法.对竞争情报系统中的文献进行检索效果比较,表明采用后控制的文献检索其查全率有显著的提高.  相似文献   

17.
18.
在信息技术的不断发展中,人们对信息服务的要求越来越高,特别是信息服务的质量以及个性化受到人们的广泛关注。本文笔者在UCL的基础上,对网页信息的自动分类和标引技术进行了分析和探讨,目的是为提高信息服务的质量和水平提供指导和借鉴,进而有效的提高信息服务的质量,推动信息技术的健康可持续发展,最终实现信息资源的合理整合,满足用户的个性化需求。  相似文献   

19.
本系统将分词技术对停用词表的利用相结合,对上百篇中文科技文献标题做了自动抽词标引, 以得了很好的标引效果。  相似文献   

20.
基于潜在语义标引的WEB文档自动分类   总被引:7,自引:1,他引:6  
Web挖掘技术在商业上有广泛的应用前景,但现有的Web挖掘技术存在计算量大,精度不高等问题。论文提出的LSIWAC算法,首先运用潜在语义标引技术将Web页面词空间压缩到低维的特征空间;然后,在得到的特征空间上运用最优聚类将样本集合分为若干簇;对得到的每簇鉴别特征再利用最佳鉴别变换进行压缩和特征抽取,并用最终得到的特征矢量进行分类。该方法克服了样本高维效应,有效提高分类准确率,降低计算量。实验结果验证所提方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号