首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   5篇
  免费   1篇
自动化技术   6篇
  2008年   1篇
  2007年   1篇
  2006年   2篇
  2005年   1篇
  2004年   1篇
排序方式: 共有6条查询结果,搜索用时 0 毫秒
1
1.
信息检索的嬗变   总被引:1,自引:0,他引:1  
熊文新 《软件世界》2004,(11):70-72
10月22日,微软首席财务长John Connors宣布该公司将于年底之前推出MSN品牌的桌面搜索工具。之前不久,微软亚洲研究院在原有四大研究方向的基础上,增加了互联网搜索和数据挖掘为该机构的第五大研究方向。信息搜索市场的走势和技术的演变再次走到聚光灯下……  相似文献   
2.
信息检索用户查询语句的停用词过滤   总被引:5,自引:0,他引:5       下载免费PDF全文
熊文新  宋柔 《计算机工程》2007,33(6):195-197
针对以自然语言形式提出的查询请求,区分信息需求表述和信息内容两部分。基于近20万语句的查询语料库和背景语料人民日报对照,提出汉语通用停用词和查询专用的相对停用词,采用左右熵和Ngram方法及KL距离脱机构造相应候选词表。根据候选词语的Bigram属性和句中不同位置的分布特点,给出了在线动态识别停用词的方法。实验结果表明,该文的方法比单纯根据静态停用词表标注效果要好。  相似文献   
3.
中间语言转换过程中的增强处理   总被引:2,自引:0,他引:2  
在基于中间语言的多语信息交流平台中,确保自然语言表述的信息内容能正确地转换为相应的中间语言表示非常重要。作者在引入子语言后,将源语转换和目标语生成过程结合起来,人机交互的界面处理既提升了源语信息转换的准确性,又提高了目标语生成的自然度,从而进一步增强了多语信息交流平台的可行性。  相似文献   
4.
熊文新  宋柔 《计算机科学》2008,35(2):181-184
根据对当前主流信息检索测试Query的形式和内容分析,通过正则表达式将SGML形式的Query表述区分为不同描述域和主题功能块,针对处于不同区域的词语实施不同的加权策略.实验表明,结合主题词语的区域凸显和TF×IDF的加权方法比单纯TFXIDF方法MRR值高出26.67%.  相似文献   
5.
熊文新  宋柔  袁琦 《计算机科学》2006,33(8):256-259
探讨了中间语言充当多语信息交流平台基础架构的必要性和可行性,介绍了一个基于中间语言的多语信息处理平台的总体设计和实现策略。讨论了如何在构建中间语言系统过程中引入子语言、受限语言技术,中间语言系统在网络环境下的XML实施,以及系统实施过程中的多引擎处理策略和学习反馈模块等支撑环境建问题,最后给出了一个示例在系统平台中运行的过程。  相似文献   
6.
熊文新  宋柔 《计算机科学》2006,33(10):144-147
以自然语言形式提出的查询问句不同于通常的关键词或主题词查询,需要提取用户真正要检索的信息内容。该文提出一个自然语言查询语句的处理框架,由3个部分构成:(1)离析查询问句的操作表述和信息内容;(2)凸显真正的信息需求内容;(3)对不同信息内容采取不同的词语实现方法。这一处理可望为自然语言信息检索提供准确的用户需永分析。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号