首页 | 本学科首页   官方微博 | 高级检索  
     

基于向量距离的词序相似度算法
引用本文:董刊生,方金云. 基于向量距离的词序相似度算法[J]. 中文信息学报, 2009, 23(3): 45-51
作者姓名:董刊生  方金云
作者单位:中国科学院 计算技术研究所 空间信息处理技术实验室,北京,100190
摘    要:手机POI搜索已经成为手机搜索的主要应用之一。该文结合手机搜索的特点以及POI数据的结构性特征采用简拼进行POI搜索。由于词序相似度是影响简拼搜索排序结果的主要因素,该文提出了基于向量距离计算词序相似度的算法。该算法采用空间向量模型作为简拼的表示方法,将提取的公共简拼映射为位置向量,进而利用位置向量间的距离计算词序相似度。通过理论分析,该算法相比基于逆序数的词序相似度算法,将时间复杂度由O(nlogn)降为O(n),空间复杂度由O(n)降为O(1)。实验结果表明,基于向量距离的词序相似度算法有效地保证了准确性,可以满足手机POI简拼搜索的应用需求,并在性能上将词序相似度的计算效率提高16.88%。

关 键 词:计算机应用  中文信息处理  手机POI搜索  简拼搜索  词序相似度  向量距离
  

Word Order Similarity Algorithm Based on Vector Distance
DONG Kansheng,FANG Jinyun. Word Order Similarity Algorithm Based on Vector Distance[J]. Journal of Chinese Information Processing, 2009, 23(3): 45-51
Authors:DONG Kansheng  FANG Jinyun
Affiliation:Laboratory of Spatial Information Technology, Institute of Computing Technology,
Chinese Academy of Sciences, Beijing 100190, China
Abstract:Mobile POI Search has become one of the main applications in Mobile Search.With the characters input for Mobile Search and the structural feature of POI data,Jianpin was used in the Mobile POI Search to improve the user experience.Since word order similarity is the main factor to the ranking results,an algorithm based on vector distance is devised to compute word order similarity in this paper.The algorithm first establishes the Jianpin vector space model,extracts the common part from the two Jianpin vector...
Keywords:computer application  Chinese information processing  mobile POI search  jianpin search  word order similarity  vector distance  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号