首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
为了提高搜索引擎查询结果的质量,越来越关注于对用户提交的网络查询意图的识别。基于查询session对用户提交的查询进行多维度特征提取,尽量能全面系统地描述查询分类特征,并使用SVM进行分类。实验结果表明通过结合查询的多个特征有助于识别查询意图,在人工标注的测试集中对查询意图分类的正确率达到80%。  相似文献   

2.
树型结构是一种常见的十分有效的数据组织形式,例如,用来显示文档的大纲,显示磁盘上的目录和文件结构等。在Windows中,打开“我的电脑”或“资源管理器”,轻轻点击鼠标,就可很快找到一个目录和文件,正是利用了这种分层显示的信息组织形式。 在处理关系模型数据库时,如果将信息组织成树形结构,同样可以利用鼠标的点击,一层层展开数据并查找到所  相似文献   

3.
查询歧义作为查询分类的子问题在信息检索领域已经得到了很多的关注,现有的研究主要是对查询内容上的歧义进行分类,而忽略了用户查询需求形式上的歧义。该文针对查询需求歧义问题进行了研究,提出了相应的查询需求分类模型。该文利用网页目录构建用户需求形式分类体系及站点列表,在大规模商业搜索引擎日志上进行用户点击覆盖检测,从而得到对查询需求形式的描述。该文的贡献在于提供了一种实际可行的查询需求分类方法,搜索引擎可以根据用户需求的区别调整排序方式,从而改善搜索性能。  相似文献   

4.
王冠  裘正定 《微机发展》2005,15(3):136-138,141
AIP(All day Information Pursue)平台,即全天候信息跟踪平台,作为关注多方面消息的企业或团体查看Internet上新信息的一种解决方案,弥补了搜索引擎一些方面的不足。它能够从Internet上获取每日的新信息,利用网页自动分类去除不相关文章。通过此平台.用户可以按时间、按类别来查看信息,也可以对文章加以标注推荐给别人阅读。  相似文献   

5.
Web检索查询意图分类技术综述   总被引:8,自引:1,他引:7  
查询分类是近年来信息检索领域的研究热点,并且在很多领域得到了广泛地关注。主要讨论根据查询的意图进行分类的研究工作,从查询分类的诞生背景、关键技术、所使用的分类方法和评价方法方面进行综述评论,提出了查询意图分类面临的问题和挑战。认为缺乏权威的评测标准、在大规模数据集上的未经全面测试的性能、如何准确地获取查询的特征以及如何证明分类体系的完备性和独立性是目前查询意图分类研究的关键问题。  相似文献   

6.
数字图书馆中查询结果的自动分类算法的设计   总被引:1,自引:0,他引:1  
文章针对数字图书馆查询时返回过多的结果提出了对查询结果进行自动分类的算法,以便提高查询的速度和准确性。  相似文献   

7.
Deep Web数据源自动分类   总被引:1,自引:0,他引:1  
随着World Wide Web(WWW)的飞速发展,Deep Web中蕴含了海量的可供访问的信息,并且还在迅速地增长.其中大部分的Deep Web是结构化的,把这些结构化的Deep Web按其领域进行分类,是Deep Web集成查询接口生成的一个非常重要的步骤.文中提出了一种利用朴素贝叶斯分类的方法,并通过实验证明了其有效性.  相似文献   

8.
分类查询是网络信息检索的重要组成部分.文章介绍了一个中文网页分类查询系统的设计与实现方法.由于人工分类费时费力,而自动分类需要大量训练数据,因此在实现该系统时提出了一种基于用户推荐机制的解决方案.  相似文献   

9.
互联网上很多资源蕴含人类群体智慧.分类网站目录人工地对网站按照主题进行组织.基于网站目录中具有主题标注的URL设计URL主题分类器,结合伪相关反馈技术以及搜索引擎查询日志,提出了自动、快速、有效的查询主题分类方法.具体地,方法为2种策略的结合.策略1通过计算搜索结果中URL的主题分布预测查询主题,策略2基于查询日志点击关系,利用具有主题标注的URL,对查询进行标注获取数据并训练统计分类器预测查询主题.实验表明,方法可获得比当前最好算法更好的准确率,更好的在线处理效率并且可基于查询日志自动获取训练数据,具有良好的可扩展性.  相似文献   

10.
基于本体的Deep Web查询接口分类   总被引:1,自引:0,他引:1  
目前对于分类问题,主要工作集中在文本或Web文档的分类研究,而很少有对deep Web查询接口的分类研究.deep Web源包括查询接口和查询结果,大量的deep Web源的存在,对它们查询接口的分类是通向deep Web分类集成和检索的关键步骤.本分提出一种deep Web本体分类方法,包括:分类本体的概念模型和由此产生的deep Web空间向量模型(VSM).试验表明,这种分类方法具有良好的分类效果,平均准确率达到91.6%,平均查全率达到92.4%.  相似文献   

11.
文章分析了传统搜索引擎的缺点,提出了一种基于网页自动分类的分类查询搜索引擎新模型,重点阐述了利用粗糙集进行文本分类的方法,提出了一种基于特征矩阵的决策表约简算法,并以此实现了网页自动分类器。  相似文献   

12.
针对老人、小孩等部分人群对垃圾分类方法不太容易分清的问题,提出了一套基于人体感应和语音提示的城市生活垃圾分类自动提醒与查询装置.系统主要由STM32单片机核心控制系统、LD3320语音识别模块、人体感应模块、语音播报模块以及TFT显示屏等部分构成.通过在系统内集成语音词库和匹配算法实现对垃圾自动分类提示,并在对应的垃圾...  相似文献   

13.
可复用构件的分类与查询方法研究   总被引:7,自引:0,他引:7  
构件库是软件复用技术的核心,而可复用构件的表示、分类、检索是构件库的关键。论文从构件的分类和检索两个角度出发,研究了刻面分类的特点以及刻面的表示,给出了基于刻面检索的形式化匹配定义,描述了构件的匹配度,详细讨论了刻面分类和基于刻面分类的构件查询技术。  相似文献   

14.
AIP(All day Information Pursue)平台,即全天候信息跟踪平台,作为关注多方面消息的企业或团体查看Internet上新信息的一种解决方案,弥补了搜索引擎一些方面的不足.它能够从Internet上获取每日的新信息,利用网页自动分类去除不相关文章.通过此平台,用户可以按时间、按类别来查看信息,也可以对文章加以标注推荐给别人阅读.  相似文献   

15.
刘彬  岳丽华  柳刘 《计算机工程与应用》2005,41(27):168-170,192
在位置相关持续查询的结果发布过程中,提出针对每个移动客户单独调整传送窗口大小的增强型自调整周期传送方法,并在此基础上,根据持续查询有效期内查询目标的状态采取更有针对性的动态分类传送方法,以达到在结果发布过程中降低控制消息开销,减少重新传送的可能性的目的。  相似文献   

16.
传统的SPARQL查询引擎在处理查询时以三元组模式为基本单位做查询优化处理,在三元组模式较多时存在着过多的连接操作,开销比较大。文中基于文档数据库的存储和查询特点,提出一种利用主语分类的方式来存储RDF数据的方法,将不同的RDF三元组按主语分成不同的类,并存入文档数据库的文档中。在处理SPARQL查询时将三元组模式也按照主语分类,构成以主语相关块为单位的查询图,并提出一种基于属性相关性的选择度估计方法来优化查询执行计划。文中利用文档数据库CouchDB实现了新的SPARQL查询引擎,实验证明文中的方法能够提高SPARQL基本图模式查询的效率。  相似文献   

17.
分类查询是网络信息检索的重要组成部分。文章介绍了一个中文网页分类查询系统的设计与实现方法。由于人工分类费时费力,而自动分类需要大量训练数据,因此在实现该系统时提出了一种基于用户推荐机制的解决方案。  相似文献   

18.
Internet中文信息搜索引擎评析   总被引:3,自引:0,他引:3  
介绍搜索引擎的分类、对比和查询技巧。  相似文献   

19.
基于中文文本分类的分词方法研究   总被引:13,自引:1,他引:13  
文本分类有助于用户有选择地阅读和处理海量文本,因此其预备工作分词系统的研究是很有意义的。该文主要提出了一种基于中文文本分类的分词方法,区别于常用的基于字符串匹配等方法,并利用数据库特有的查询技术设计和实现了该分词系统,旨在通过新的分词方法提供更加准确的分词率,同时提高系统实现效率。  相似文献   

20.
邮件监控是网络信息安全的一个重要方面。而监控得到的邮件的处理是一项困难的工作。本文提出并实现了一种应用于邮件监控的邮件处理方式。首先将邮件转换为结构性较强的XML文档,然后通过搜索过滤方式得到初步邮件集,在此基础上对邮件的不同节点应用基于内容的文本分类进一步对邮件进行类别划分。实验证明,该处理方式是行之有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号