首页 | 本学科首页   官方微博 | 高级检索  
     

新的基于中间语义的多语言信息检索模型
引用本文:邹小芳,王明文,左家莉,余美华.新的基于中间语义的多语言信息检索模型[J].小型微型计算机系统,2010,31(4).
作者姓名:邹小芳  王明文  左家莉  余美华
作者单位:1. 江西师范大学,计算机信息工程学院,江西,南昌,330022
2. 江西师范大学,高等职业技术学院,江西,南昌,330027
基金项目:国家自然科学基金项目,江西省自然科学基金项目,江西省科技攻关项目,江西省教育厅科技课题,江西省研究生创新专项资金项目 
摘    要:在统一框架下对双语语料库的平行文档进行分析建模,提取语言之间的潜在语义对应关系,在潜在中间语义空间中进行检索,从而实现跨语言信息检索.作者在自建的中英平行语料库和蒙特利尔大学提供的英法平行语料库基础上,对平行文档进行分析建模,在TREC5&9和SDA数据集上进行了中、英、法三种语言的跨语言信息检索实验,且与单语言的信息检索模型进行了比较,实验结果显示本文的模型表现了较好的性能.

关 键 词:多语言信息检索  平行语料库  中间语义  潜在中间语义空间

New Multilingual Information Retrieval Model Based on Latent Interlingua Semantics
ZOU Xiao-fang,WANG Ming-wen,ZUO Jia-li,YU Mei-hua.New Multilingual Information Retrieval Model Based on Latent Interlingua Semantics[J].Mini-micro Systems,2010,31(4).
Authors:ZOU Xiao-fang  WANG Ming-wen  ZUO Jia-li  YU Mei-hua
Affiliation:ZOU Xiao-fang1,WANG Ming-wen1,ZUO Jia-li2,YU Mei-hua11 (School of Computer , Information Engineering,Jiangxi Normal University,Nanchang 330022,China)2 (School of Advanced Technology , Vocation,Nanchang 330027,China)
Abstract:In this paper,we try to exploit parallel documents in the bilingual corpus in the unified framework,so as to extract latent semantic correspondences between the languages,and to retrieve information in a resulting latent interlingua semantic space.Cross-language information can be retrieved using such a space.To this end,we built a Chinese-English parallel corpus and used an English-French parallel corpus from the University of Montreal,which are exploited to perform Chinese,English and French trilingual cr...
Keywords:multilingual information retrieval  parallel corpus  interlingua semantics  latent interlingua semantic space  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号