首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
变分贝叶斯、吉布斯采样和消息传递是求解潜在狄利克雷分配(LDA)模型的三种主要近似推理算法,消息传递算法在效率和准确率上都明显优于其他两种。为了获得高可解释性的潜在语义空间,提出在迭代过程中动态调整先验参数的消息传递算法,使用加入伽马先验的固定点迭代方法自动学参数,同时探索对称先验以及非对称先验对模型泛化能力及文本分类准确率的影响。实验结果表明提出的动态非对称先验算法改进了模型的泛化能力,提高了文本分类的准确率。  相似文献   

2.
标签传递算法是一种半监督分类方法,由于该算法存在要求数据分类结果符合流行假设、数据维数较高时计算复杂度高等问题,在文本分类中效果较差。针对这些问题,经过对LDA主题模型和标签传递算法原理及复杂度的分析,将两者结合,提出一种基于LDA主题模型的标签传递算法LPLDA。该算法用LDA主题模型中的主题表示文本数据,一方面使用LDA主题模型表示文本保证分类结果符合流行假设,另一方面有效减少标签传递算法相似度计算时间。经过实验证明,该算法在标记数据少于待测样本时,分类效果优于传统的有监督分类方法。  相似文献   

3.
LDA是生成武概率模型,从理论上说,具有其他模型无可比拟的建模优点;SVM分类算法在文本分类上具有独特的优异性能,本文将前者良好的文本表示性能、降维效果与后者强大的分类能力结合起来。实验表明,该方法克服了传统选择方法带来的分类性能受损问题,并且能够在降低数据维度的象件下提高分类的正确率。  相似文献   

4.
随着移动通信技术的发展和移动设备的普及,关于人们日常移动行为的轨迹数据记录愈发的丰富起来。海量的轨迹数据背后隐藏着关于人及人类社会的有价值的知识模式。为了使基于轨迹数据产生的知识模式更精准有效服务用户,能够准确、可靠地恢复缺失电信轨迹显得尤为重要。目前大多数方法主要针对GPS轨迹等连续轨迹进行建模,而缺乏对移动通信场景中产生的电信轨迹恢复的研究。因此,针对电信轨迹缺失恢复问题,将电信轨迹恢复问题转化为矩阵补全问题,提出了一种基于LDA主题模型的恢复算法。实验中,与传统矩阵补全算法进行综合比较,并观察了不同参数对轨迹恢复效果的影响。实验结果表明,与传统矩阵补全算法相比,运用LDA主题模型能够显著提高缺失电信轨迹的恢复精度。  相似文献   

5.
LDA主题模型     
在自然语言处理领域,LDA主题模型是进行文本语义挖掘的一种统计模型,用来发现文档中的隐含主题,将词项空间表达的文档约简为主题空间的低维表达,实现信息检索、文本分类等。本文阐述了LDA模型的文档生成过程、LDA模型的图模型表示、基于LDA的扩展模型以及未来的研究趋势。  相似文献   

6.
主题情感混合模型可以有效地提取语料的主题信息和情感倾向。本文针对现有主题/情感分析方法主题间区分度较低的问题提出了一种词加权LDA算法(weighted latent dirichlet allocation algorithm,WLDA),该算法可以实现无监督的主题提取和情感分析。通过计算语料中词汇与情感种子词的距离,在吉布斯采样中对不同词汇赋予不同权重,利用每个主题下的关键词判断主题的情感倾向,进而得到每篇文档的情感分布。这种方法增强了具有情感倾向的词汇在采样过程中的影响,从而改善了主题间的区分性。实验表明,与JST(Joint Sentiment/Topic model)模型相比,WLDA不仅在采样中迭代速度快,也能够更好地实现主题提取和情感分类。  相似文献   

7.
基于LDA模型的主题词抽取方法   总被引:1,自引:0,他引:1       下载免费PDF全文
石晶  李万龙 《计算机工程》2010,36(19):81-83
以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速Gibbs抽样算法进行。实验结果表明,快速Gibbs算法的速度约比传统Gibbs算法高5倍,准确率和抽取效率均较高。  相似文献   

8.
基于LDA模型的文本分割   总被引:9,自引:0,他引:9  
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用.基于LDA模型的文本分割以LDA为语料库及文本建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,获取词汇的概率分布,使隐藏于片段内的不同主题与文本表面的字词建立联系.实验以汉语的整句作为基本块,尝试多种相似性度量手段及边界估计策略,其最佳结果表明二者的恰当结合可以使片段边界的识别错误率远远低于其它同类算法.  相似文献   

9.
基于LDA模型的主题分析   总被引:9,自引:0,他引:9  
石晶  范猛  李万龙 《自动化学报》2009,35(12):1586-1592
在文本分割的基础上, 确定片段主题, 进而总结全文的中心主题, 使文本的主题脉络呈现出来, 主题以词串的形式表示. 为了分析准确, 利用LDA (Latent dirichlet allocation)为语料库及文本建模, 以Clarity度量块间相似性, 并通过局部最小值识别片段边界. 依据词汇的香农信息提取片段主题词, 采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外, 尝试挖掘隐藏于字词表面之下的文本内涵. 实验表明, 文本分析的结果明显好于其他方法, 可以为下一步文本推理的工作提供有价值的预处理.  相似文献   

10.
11.
《计算机工程》2017,(4):177-182
通过基于概率的主题挖掘模型隐含狄利克雷分布(LDA)挖掘用户兴趣主题,是目前最常用的用户兴趣主题挖掘方法。为进一步改善用户体验,推荐其感兴趣且质量好、新鲜度高的微博,提出一种新的多角度个性化微博推荐算法。通过微博发布时间、转发数、评论数等特征计算微博重要度,利用LDA模型生成的用户-主题矩阵以及主题-词汇矩阵计算用户对微博的兴趣度,综合考虑微博本身的重要度以及用户对微博的兴趣度对微博进行评分,根据评分结果推荐微博。实验结果表明,该算法与主题模型相结合可有效够提高微博推荐的精准度。  相似文献   

12.
本文考虑了模型与真实模式之间可能存在的差异,分析了由此引发的问题.提出一种基于模型误差的交互式多模型算法,其中模型集合使用最小距离设计方法设计.Monte-Carlo仿真实验表明,新方法比IMM能更好地避免性能恶化,并且当真实模式保持不变时,从全局角度考虑新算法比IMM优越.  相似文献   

13.
基于表面模型的油藏储层可视化算法研究   总被引:2,自引:0,他引:2  
油藏储层的可视化可以直观和充分地反映油藏储层参数在空间的分布状态,文章研究了基于表面模型的油藏储层可视化的相关算法,它包含三维网格化数据体的建立、可视化数据的形成以及模型的映射和着色。在网格化和可视面数据形成的过程中,采用随机模拟的方法,针对不同的属性参数分别建模,符合地质认识,最后给出了油藏储层分布的实例,达到了将油藏储层直观展示的目的。  相似文献   

14.
针对传统数据模型描述方式无法满足用户快速理解和使用数据模型的不足,论文提出建立数据模型的三维可视化描述.对于传统FR算法在实体节点过多时将导致图形绘制过慢、连线交叉过多等问题,论文结合数据模型的特点,基于实体结构和实体属性对FR算法进行改进,改进后的FR算法不仅能快速地绘制三维图形,而且可以显示实体节点及实体关联等信息,从而辅助建立三维可视化模型,直观的表达数据模型,梳理数据模型的结构,加快用户对数据模型的理解.  相似文献   

15.
基于改进LDA算法的人脸识别   总被引:1,自引:0,他引:1  
提出一种基于改进LDA的人脸识别算法,该算法克服传统LDA算法的缺点,重新定义样本类间离散度矩阵和Fisher准则,从而保留住最有辨别力的信息,增强算法的识别率.实验结果证明该算法是可行的,与传统的PCA LDA算法比较,具有较高的识别率.  相似文献   

16.
提出了一种基于奇异值分解与改进的LDA相结合的人脸识别方法。首先利用奇异值分解方法获得图像的有效特征;然后经过改进的LDA处理,这样不仅可以有效降低维数,而且使抽取特征的判别能力得到了有效增强;最后对压缩后的特征向量进行排序,将排序后的特征送入BP网络进行识别。实验结果表明,该方法在低维特征向量下取得了很高的识别率,达到99%,效果优于传统方法。  相似文献   

17.
在社会网络话题模型中,一些频繁出现的单词往往出现在不同的话题中。用户往往对这些单词感兴趣,因而分析时不能省略,这给话题分析带来了严重的挑战。为了解决这一问题,本文显示的对话题模型中的节点的流行性进行建模,提出了一种考虑节点重要性的LDA社会网络话题模型。在该模型中,本文提出了流行性组件的概念,并提出了一种包含了流行性组件的扩展话题模型。通过实验结果表明,本文提出的包含流行性组件的扩展话题模型具有更好的预测能力,其预测结果的准确性明显优于现有的相关研究。  相似文献   

18.
改进的交互式多模型跟踪算法   总被引:2,自引:2,他引:0       下载免费PDF全文
刘涛  李明  骆瑞玲 《计算机工程》2009,35(22):207-209
针对传统交互式多模型算法实行正则滤波的单一化缺点,提出一种改进的跟踪算法。利用卡尔曼滤波匹配系统线性部分,粒子滤波匹配非线性部分,根据匹配深度判断目标遮挡程度,当目标被严重遮挡时,采用迭代的多级粒子滤波方法进行重采样,并结合卡尔曼滤波更新模型概率。实验结果表明,该算法实时性强,能提高模型滤波速度和目标状态的估计精度,缩短计算时间,解决跟踪过程中的遮挡问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号