首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 4 毫秒
1.
移动设备的发展使得轨迹数据可以记录更多有用的信息,比如签到信息、活动信息,构成了语义轨迹数据.快速有效的轨迹相似度计算会为分析问题带来巨大好处,已有学者对轨迹相似性及语义轨迹相似性做出研究,并提出了一些有效的方法.但是现有轨迹相似性计算方法无法应用于语义轨迹数据,而目前的语义轨迹相似性计算方法又在轨迹采样频率低的情况下...  相似文献   

2.
AIS(Automatic Identification System)是一种船舶的自动识别系统,可以提供船舶的时间戳、经纬度、航向角度、速度等数据信息.本文针对船舶航行轨迹多维度的特点以及对船舶轨迹预测的精确度和实时性的需求,提出了一种基于图像检测和匹配的计算轨迹相似度的方法.该方法首先将所有渔船轨迹数据进行可视化,...  相似文献   

3.
针对低阶Markov模型预测精度较差,以及多阶Markov模型预测稀疏率高的问题,提出一种基于Markov模型与轨迹相似度(MMTS)的移动对象位置预测算法。该方法借鉴了Markov模型思想对移动对象的历史轨迹进行建模,并将轨迹相似度作为位置预测的重要因素,以Markov预测模型的预测结果集作为预测候选集,结合相似度因素得出最终预测结果。实验结果表明,与k阶Markov模型相比,该方法的预测性能不会随着训练样本大小及阶数k的变化受到很大的影响,并且在大幅降低k阶Markov模型预测稀疏率的同时将预测精度平均提高了8%以上。所提方法不仅解决了k阶Markov模型的预测稀疏率高及预测精度不足的问题;同时提高了预测的稳定性。  相似文献   

4.
轨迹相似性度量是轨迹数据挖掘的基础问题。受设备型号、信号强度和周围环境的影响,轨迹数据具有噪声大、数据量大、采样不均匀等特征,给轨迹相似性度量带来了极大的挑战。因此,提出了基于时空金字塔匹配的轨迹相似度算法,通过在时间和空间维度上对轨迹进行不同粒度的划分,然后利用不同粒度的权重组合来衡量轨迹之间的相似性。该算法能够有效克服轨迹噪声的影响,同时兼顾了轨迹的时间特性和空间特性,并具有较低的计算复杂度。最后,利用真实的信令数据集和人工合成的全球定位系统数据集进行实验,实验结果证明了该算法在准确率和计算复杂度方面都优于目前的主流算法。  相似文献   

5.
语义相似度计算的应用范围广泛,从心理学、语言学、认知科学到人工智能都有其应用.提出了仅依赖于知网(HowNet)的信息量计算来估计两个词汇间的语义相似度.经实验证明,相比于传统的基于词网(WordNet)和大型语料库的计算信息量来估计语义相似度的算法,本文的算法更容易计算,并更接近于人工的语义相似度判断.  相似文献   

6.
基于本体的概念相似度计算   总被引:11,自引:2,他引:9       下载免费PDF全文
概念相似度的计算是信息检索领域的研究热点。本体在信息检索和人工智能领域的广泛应用,为概念相似度计算带来新的方法。该文提出一种利用本体来计算概念间相似度的方法,综合考虑语义距离和本体库统计特征。加入概念的深度、语义重合度和概念间强度的辅助影响。实验结果表明,该方法对概念相似度的计算有效,可应用于面向Web的信息检索。  相似文献   

7.
基于改进编辑距离和依存文法的汉语句子相似度计算   总被引:3,自引:0,他引:3  
句子相似度计算在中文自然语言处理领域有着广泛的应用背景。要准确地刻画一个句子所表达的意思,必须深入到语义层面级并结合语法结构信息,提出了一种基于改进编辑距离和依存文法的汉语句子相似度计算方法。依存文法考虑到句子内部的结构和词语之间的相互作用关系,而编辑距离由于《同义词词林》的应用可以兼顾同义词之间的替换,因此该方法与其他方法相比,描述句子的信息更加全面,试验结果表明该方法是有效的。  相似文献   

8.
语义相似度是语义网络和信息检索领域的重要内容.本体结构为语义相似度计算提供了新的思路,但现有的方法都存在着不同程度的缺陷.为了提高已有方法的有效性,在分析语义相似度经典方法的基础上,充分利用本体的结构信息,综合考虑概念在本体图中的位置、语义距离,共享属性量和共享信息等因素,提出了一个基于本体结构的语义相似度算法.实验部分以维基百科中公开发布的氨基酸本体为例,通过与经典方法计算结果的对比,证明了算法的有效性.  相似文献   

9.
移动网络和智能终端的发展使得基于优质用户的伴随人员的推荐成为互联网发展的热点之一,而伴随人员的推荐算法则是至关重要的因素.针对以往基于地理位置的用户轨迹性相似推荐算法中需基于地理位置或基站数据,且数据稀疏时推荐结果不理想的问题,提出了基于IP场所的轨迹余弦相似度的伴随人员推荐,以更完善的IP场所数据代替地理位置数据,以一段时间的纵向日期和横向时刻分别计算余弦相似度以消除数据稀疏性问题.最后推荐出了相似度质量更高的伴随人员.  相似文献   

10.
提出了基于语义相似度和相关度的综合概念相似度计算方法.语义相似度考虑了语义距离和本体库特征,加入概念的信息量、概念的深度、概念的密度和不对称因子的辅助影响;语义相关度从直接相关、间接相关、直接继承和间接继承几个方面考虑.通过实验和两种传统的语义相似度计算方法进行对比,本方法能更好地区分本体树中不同关系的概念对,验证了该方法的有效性.  相似文献   

11.
改进的概念语义相似度计算   总被引:2,自引:0,他引:2  
在相似度计算中,本体能够将各种概念及相互关系明确地,形式化地表达,因而发挥着重要的作用.为了使相似度计算结果更为精确,考虑更全面的利用本体中的关系,和相似度计算在特定领域中应用的特点,提出一个改进的相似度计算模型.利用上下位关系计算相似度,非上下位关系计算相关度,将二者合成,并同时考虑语义检索领域中,相似度计算的不对称性.经过实验验证了该方法有效且精确.  相似文献   

12.
社交网络中消息的流行度预测问题在很多应用领域都有着重要意义。传统的流行度预测方法包括基于特征的方法和基于点过程的方法。基于点过程的方法无法利用历史消息的信息,而基于特征的方法则使用一个统一的模型来对所有的消息进行预测,没有考虑消息的特异性。因此,该文提出了一种基于相似消息的流行度预测方法。对于待预测微博,我们从历史消息选取出与之最相似的前K条消息来进行预测。在计算消息相似度时,我们借助了文档建模领域的LDA模型来学习消息的表示。在数据集上的实验结果表明,该方法可以有效发现在传播模式上与待预测消息相似的历史消息,并在流行度预测任务上取得了比对比模型更好的预测效果。  相似文献   

13.
郑明明  林志毅 《计算机工程》2019,45(10):266-271
基于双调和距离的等距不变性,提出一种三维形状的相似性度量方法。给出双调和距离、形式化表达和离散计算的定义,并对形状的双调和距离矩阵进行奇异值分解。提取双调和距离矩阵的特征值作为形状描述符,将一对形状特征值的余弦距离作为形状相似度。通过TOSCA2010数据库上的实验结果表明,与FMPS方法、SHED方法相比,该方法能够较好地兼顾时间耗费度和形状匹配度。  相似文献   

14.
基于上下文的概念语义相似度计算模型   总被引:2,自引:0,他引:2       下载免费PDF全文
吕林涛  董迎 《计算机工程》2010,36(21):59-61
针对概念语义相似度计算方法在信息检索中存在的漏检、误检等问题,提出一种基于上下文的计算本体内概念间语义相似度的模型。该模型分别从概念的父节点、子节点以及概念间路径权重3个角度进行计算,加权求和并求得语义相似度。实验结果表明,该模型的计算结果更加接近专家的经验值,为概念之间的语义关系提供了有效的量化。  相似文献   

15.
赵亮  刘建辉  王星 《计算机科学》2016,43(6):280-282, 307
分类变量的相似度分析是数据挖掘任务中的一个重要环节,现有的分类变量相似度算法中存在忽视变量差异、受不均衡分布影响严重、无法应用于混合数据集等缺点。为克服以上缺点,提出了一种基于Hellinger距离的分类变量相似度算法。该算法累加分类变量对应子集中不同属性变量的分布差异作为相似度,且支持混合数据集。将所提算法代入聚类算法并应用于UCI公共数据集,结果表明,该算法在准确度、有效性和稳定性上都有较大提高。  相似文献   

16.
一种融合多种编辑距离的字符串相似度计算方法*   总被引:5,自引:0,他引:5  
针对中西文混合字符串,采用了将汉字作为西文字符的等价单位计算编辑距离的方法,并从输入法的角度提出了采用拼音编码和五笔编码计算编辑距离的方法,最后给出了融合三种编辑距离计算字符串相似度的算法。仿真结果表明,该方法在提高相似重复记录检测的查全率的同时,也能获得较高的查准率。  相似文献   

17.
领域本体的概念相似度计算   总被引:11,自引:1,他引:11  
随着本体在信息检索、人工智能等领域的广泛应用,面向本体的概念相似度计算成为了本体研究的一大热点。当前领域本体中概念相似度的研究主要是利用概念的上下位关系进行计算,但这并没有完整反映出概念的语义信息。论文提出的算法将概念相似度计算分为两层,一层是概念语义初始相似度层,其主要利用概念之间的距离来计算概念的初始相似度。另一层是概念非上下位关系相似度层,其在概念初始相似度的基础上,计算概念通过非上下位关系体现出的相似度。最后通过综合计算,得到领域本体中概念的实际相似度。实验证明,该方法充分利用了本体中概念的语义信息,得到的结果也比较合理。  相似文献   

18.
手机POI搜索已经成为手机搜索的主要应用之一。该文结合手机搜索的特点以及POI数据的结构性特征采用简拼进行POI搜索。由于词序相似度是影响简拼搜索排序结果的主要因素,该文提出了基于向量距离计算词序相似度的算法。该算法采用空间向量模型作为简拼的表示方法,将提取的公共简拼映射为位置向量,进而利用位置向量间的距离计算词序相似度。通过理论分析,该算法相比基于逆序数的词序相似度算法,将时间复杂度由O(nlogn)降为O(n),空间复杂度由O(n)降为O(1)。实验结果表明,基于向量距离的词序相似度算法有效地保证了准确性,可以满足手机POI简拼搜索的应用需求,并在性能上将词序相似度的计算效率提高16.88%。  相似文献   

19.
根据概念相似信息,文中提出了一种新的文本相似度计算方法.新方法首先将文本转换为词向量空间模型,然后将词分解为概念集合,通过计算概念间的内积空间,得到词之间的相似度,最后根据词之间的相似度,计算文本相似性.文中的主要工作包括:1)提出了一种新的词相似度计算公式;2)提出了一种新的基于词相似度的文本相似计算方法;3)成功的将该方法应用到WEB新闻相似查询中;4)通过实验证明算法的有效性.  相似文献   

20.
使用相似度图计算FCA概念相似度需要构造相似关系的传递闭包,对于复杂问题会导致相似度图规模过大,从而影响相似度评价的效率.为了降低相似度图规模,提出一种基于限界传递相似度图的FCA概念相似度计算方法.该方法首先通过限定传递相似关系的长度来避免构造相似关系的传递闭包,得到的限界传递相似度图中忽略了长度超过界限且对区分FCA概念无用的传递相似关系,能够有效压缩相似度图的规模;然后给出了动态传递相似度计算方法和由限界传递相似度图构建二部图的方法.实验结果表明,使用限界传递相似度图能够在不损失计算结果准确度的情况下有效提高FCA概念相似度计算的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号