首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
在移动对象轨迹预测中,针对低阶马尔可夫模型预测准确率不高、高阶模型状态空间膨胀的问题,提出一种基于概率后缀树(PST)的动态自适应变长马尔可夫模型预测方法。首先依时间先后将移动对象的轨迹路径序列化;然后根据移动对象的历史轨迹数据进行学习训练,计算序列上下文的概率特征,建立路径序列的概率后缀树模型,结合当前实际轨迹数据,动态自适应预测将来的位置信息。实验结果表明,该模型在二阶时取得最高的预测精度,随着阶数的增加,预测精度保持在82%左右,能取得较好的预测效果;同时空间复杂度呈指数级减少,大大节省了存储空间。该方法充分利用历史轨迹数据和当前轨迹信息预测未来轨迹,能够提供更加灵活、高效的基于位置服务。  相似文献   

2.
黄光球  赵永梅 《计算机应用》2008,28(6):1601-1604
考虑到用户浏览路径、时间、浏览次数都是影响推荐准确度的重要因素,提出一种基于隐马尔可夫模型(HMM)的动态协同过滤推荐方法。该方法首先用HMM模型模拟用户浏览网页时的行为,根据用户浏览网页时的行为建立最近邻集合。由于数据不是简单的用户评分,而是用户浏览网页的路径,这样就解决了数据稀疏问题和最初评价问题。并且使用HMM代替简单的相似模型来度量用户相似性,提高了最近邻推荐的准确性,解决了实时性推荐和数据空间的可扩展的问题。然后,提出了喜好度的概念并给出了计算方法,喜好度概念的加入能为目标用户推荐更适合的商品。最后,结合喜好度给出了基于HMM的协同过滤预测模型。通过对一个实例的研究验证了所提出的算法以及推荐模型的可行性。  相似文献   

3.
随着WWW的迅速发展和网络用户的急剧增加,准确预测Web用户的访问行为对减小用户的感知延时,实现个性化推荐等具有重要的作用.无论是Markov模型还是其任何一种变种,高阶模型具有较好的预测性能.然而,高阶模型通常有较高的状态空间复杂度.提出了一种新的混合阶Markov模型(HMPM),将前缀相同的序列共享存储,降低了状态空间复杂度.仿真实验结果表明,该模型在一定程度上提高了预测准确率,查全率也有所提升.  相似文献   

4.
基于向量空间模型的多主题Web文本分类方法*   总被引:2,自引:0,他引:2  
对给定的网页,提取其特征向量,计算网页特征向量与分类特征向量的相似度,使用K-means聚类方法寻找归属类得到动态阈值,提出了一种基于动态阈值的向量空间模型多主题Web文本分类方法.该方法通过网页与每个类的相似度和动态阈值的比较,实现了将包含多个主题的网页划分到相应的多个类中.实验证明,这种方法具有较好的精确度和召回率.  相似文献   

5.
随着WWW的迅速扩张和网络用户的急剧增加,准确预测Web用户的访问行为对减少用户的感知延时、提高网络服务质量具有重要作用。文章分析了传统Markov模型的优缺点,针对低阶Markov模型准确率不高,而高阶Markov模型状态空间复杂度较高的缺点,提出了一种新的K步Markov模型(K-Step Markov Model,K-SMM),并引入了偏爱度的概念,建立了基于偏爱度的多步Markov网页预测模型(Preferred K-Step Markov Model,PKSMM)。实验结果表明,该模型可以获得更高的预测准确率与覆盖率,并能有效地降低存储复杂度。  相似文献   

6.
负荷监测是实现智能用电的关键技术,为了实现非侵入式负荷检测,提出一种结合情景上下文的因子隐马尔可夫(FHMM)负荷分解方法。运用FHMM模型对负荷进行建模。根据电器工作状态的功率服从高斯分布,运用高斯混合模型进行电器状态聚类。结合情景上下文信息,对负载设备的状态转移概率进行优化消除冗余状态转移概率,对状态空间以及状态转移路径进行约束降低维特比算法的复杂度。基于REDD数据集验证了该方法的有效性和准确性。  相似文献   

7.
《计算机工程》2017,(2):220-226
针对在线教育支持技术中关于文本处理的多义词和同义词问题,提出基于内容过滤PageRank语义相似替换的Top-k学习资源推荐算法。基于内容的向量空间滤波建立学习资源过滤推荐模型,该模型采用资源间匹配方式以取代语义相似性,从而避免多义词或同义词的漏检问题。基于谷歌PageRank算法结合前述资源间匹配模型构建考虑资源间关系连接的权重矩阵,取代传统PageRank算法网页间的超链接方式,进行资源类型划分,得到特征的马尔可夫收敛矩阵,并利用Top-k算法实现推荐结果细化。实验结果表明,在公共学习资源数据集中,所提算法对计算时间的覆盖率是可行的。  相似文献   

8.
控制系统可靠性评估方法   总被引:1,自引:0,他引:1  
针对控制系统应用的特点,依据国家标准GB/T20438的建模方法,本文提出了一种利用马尔可夫预测的基本原理,将马尔可夫链引入到控制系统可靠性模型建立中,利用状态转移矩阵计算可靠性指标的方法。并提出依据系统状态化简模型的具体方法。该方法可以有效的减少马尔可夫模型的复杂度,有利于可靠性指标的具体计算。  相似文献   

9.
从观测数据中学习因果结构具有重要的应用价值。目前,一类学习因果结构的方法是基于函数因果模型假设,通过检验噪声与原因变量的独立性来学习因果结构。然而,该类方法涉及高计算复杂度的独立性检验过程,影响结构学习算法的实用性和鲁棒性。为此,提出了一种在线性非高斯模型下,利用高阶累积量作为独立性评估的因果结构学习算法。该算法主要分为两个步骤,第一个步骤是利用基于条件独立性约束的方法学习到因果结构的马尔可夫等价类,第二个步骤是定义了一种基于高阶累积量的得分,该得分可以判别两个随机变量的独立性,从而可以从马尔可夫等价类中搜索到最佳独立性得分的因果结构作为算法的输出。该算法的优势在于:a)相比基于核方法的独立性检验,该方法有较低的计算复杂度;b)基于得分搜索的方法,可以得到一个最匹配数据生成过程的模型,提高学习方法的鲁棒性。实验结果表明,基于高阶累积量的因果结构学习方法在合成数据中F1得分提高了5%,并在真实数据中学习到更多的因果方向。  相似文献   

10.
秦伟  韦岗 《微计算机信息》2006,22(22):301-303
提出一种捆绑子空间分布隐马尔可夫模型的训练方法。该方法利用多变量相关系数将语音信号的特征向量进行子空间划分;利用k均值算法捆绑特征向量子空间的高斯分布,得到子空间高斯分布的原型,减少模型的参数。通过实验,用该方法训练的捆绑子空间隐马尔可夫模型,不仅提高了识别器的精确度和识别速度,而且节省了存储空间。  相似文献   

11.
预取技术通过在用户浏览当前网页的时间内提前取回其将来最有可能请求的网页来减少实际感知的获取网页的时间.传统的Markov链模型是一种简单而有效的预测模型,但同时存在预测准确率偏低,存储复杂度偏高等缺点.通过提出一种算法来减小存储空间,最后通过证明能有效减小存储空间.  相似文献   

12.
基于联合概率矩阵分解的上下文广告推荐算法   总被引:3,自引:0,他引:3  
上下文广告与用户兴趣及网页内容相匹配,可增强用户体验并提高广告点击率.而广告收益与广告点击率直接相关,准确预测广告点击率是提高上下文广告收益的关键.目前,上下文广告推荐面临如下问题:(1) 网页数量及用户数量规模很大;(2) 历史广告点击数据十分稀疏,导致点击率预测准确率低.针对上述问题,提出一种基于联合概率矩阵分解的因子模型AdRec,它结合用户、广告和网页三者信息进行广告推荐,以解决数据稀疏时点击率预测准确率低的问题.算法复杂度随着观测数据数量的增加呈线性增长,因此可应用于大规模数据.  相似文献   

13.

Web page recommendations have attracted increasing attention in recent years. Web page recommendation has different characteristics compared to the classical recommenders. For example, the recommender cannot simply use the user-item utility prediction method as e-commerce recommendation, which would face the repeated item cold-start problem. Recent researches generally classify the web page articles before recommending. But classification often requires manual labors, and the size of each category may be too large. Some studies propose to utilize clustering method to preprocess the web page corpus and achieve good results. But there are many differences between different clustering methods. For instance, some clustering methods are of high time complexity; in addition, some clustering methods rely on initial parameters by iterative computing whose results probably aren’t stable. In order to solve the above issues, we propose a web page recommendation based on twofold clustering by considering both effectiveness and efficiency, and take the popularity and freshness factors into account. In our proposed clustering, we combined the strong points of density-based clustering and the k-means clustering. The core idea is that we used the density-based clustering in sample data to get the number of clusters and the initial center of each cluster. The experimental results show that our method performs better diversity and accuracy compared to the state-of-the-art approaches.

  相似文献   

14.
有效地预测互联网用户在浏览过程中的行为方向,尽可能有针对性的提供其感兴趣的信息,有助于提高网站的服务质量,最大限度地留住客户.马尔科夫模型是解决这一问题的一种有效建模方式.但是该模型,尤其是高阶马尔科夫模型的指数级复杂度大大影响了其实际的应用.建立新的模型需要权衡自身的预测准确度与复杂度,尽可能保持前者,同时降低后者.结合马尔科夫模型和有向图特点,提出了一种新的建模方式.新模型具有与马尔科夫模型相同的预测准确度,但是各种时间、空间复杂度相对较低,综合性能良好.  相似文献   

15.
建立有效的用户行为预测模型,准确地预测用户的上网行为,是当前网络主动管理地关键,传统的Markov模型是一种简单而有效的预测模型,但它存在测准确率低、预测覆盖率低以及存储复杂度高等缺点.提出了基于加权马尔可夫链模型,通过分析用户行为特征和最优状态分类的方法,预测网络用户行为.最后通过实验结果表明了该模型的可行性和实用性...  相似文献   

16.
The improvement of many applications such as web search, latency reduction, and personalization/ recommendation systems depends on surfing prediction. Predicting user surfing paths involves tradeoffs between model complexity and predictive accuracy. In this paper, we combine two classification techniques, namely, the Markov model and Support Vector Machines (SVM), to resolve prediction using Dempster’s rule. Such fusion overcomes the inability of the Markov model in predicting the unseen data as well as overcoming the problem of multiclassification in the case of SVM, especially when dealing with large number of classes. We apply feature extraction to increase the power of discrimination of SVM. In addition, during prediction we employ domain knowledge to reduce the number of classifiers for the improvement of accuracy and the reduction of prediction time. We demonstrate the effectiveness of our hybrid approach by comparing our results with widely used techniques, namely, SVM, the Markov model, and association rule mining.  相似文献   

17.
基于概率模型的Web信息抽取   总被引:1,自引:0,他引:1  
针对Web网页的二维结构和内容的特点,提出一种树型结构分层条件随机场(TH-CRFs)来进行Web对象的抽取。首先,从网页结构和内容两个方面使用改进多特征向量空间模型来表示网页的特征;第二,引入布尔模型和多规则属性来更好地表示Web对象结构与语义的特征;第三,利用TH-CRFs来进行Web对象的信息提取,从而找出相关的招聘信息并优化模型训练的效率。通过实验并与现有的Web信息抽取模型对比,结果表明,基于TH-CRFs的Web信息抽取的准确率已有效改善,同时抽取的时间复杂度也得到降低。  相似文献   

18.
In this work we propose a prediction by partial matching technique to anticipate and prefetch web pages and files accessed via browsers. The goal is to reduce the delays necessary to load the web pages and files visited by the users. Since the number of visited web pages can be high, tree-based and table-based implementations can be inefficient from the representation point of view. Therefore, we present an efficient way to implement the prediction by partial matching as simple searches in the observation sequence. Thus, we can use high number of states in long web page access histories and higher order Markov chains at low complexity. The time-evaluations show that the proposed PPM implementation is significantly more efficient than previous implementations. We have enhanced the predictor with a confidence mechanism, implemented as saturating counters, which classifies dynamically web pages as predictable or unpredictable. Predictions are generated selectively only from web pages classified as predictable, improving thus the accuracy. The experiments show that the prediction by partial matching of order 4 with a history of 500 web pages is the optimal.  相似文献   

19.
结合使用挖掘和内容挖掘的web推荐服务   总被引:10,自引:1,他引:9  
随着Internet的基础结构不断扩大和其所含信息的持续增长,Internet用户越来越感觉容易在WWW服务中“资源迷向”。提高用户访问效率的方法有页面预取技术,站点动态重构技术和web个性化推荐技术等。现有的大多数web个性化推荐技术主要是基于用户使用记录的数据挖掘方法,没有或很少考虑结合页面内容—这才是用户真正感兴趣的。该文提出一种结合用户使用挖掘和内容挖掘的web推荐服务,该推荐服务根据频繁最大前向访问路径,提出含有导航页和内容页的频繁访问路径图概念,根据滑动窗口内的最近用户访问页面内容和候选推荐集中页面内容相关性,来向用户提供个性化推荐服务。经推荐质量分析,这种方法具有较好的推荐优化能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号