首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
提出了基于LDA模型的商品评论主题分析框架,并以淘宝商城上商品评论数据为例实现了该框架.实验证明,该方法获得的主题与淘宝商城提供的主题词具有较高的一致性.  相似文献   

2.
机会移动社群网络易受到不良节点干扰而导致正常通信中断,现有研究方法普遍存在忽略不良行为差异性,为此,提出了基于狄利克雷分布的可信路由转发机制.利用消息传递过程判断节点的可信度,提出应对干扰的路由转发机制.实验结果表明,在受到不良节点干扰的条件下,该机制能够准确评估节点,同时在保持低传输成本的情况下,传输成功率比传统方法提高了5%~10%.  相似文献   

3.
针对无监督的主题模型无法对图像主题进行类别标记、有监督主题模型中类别信息的标记繁琐且受主观因素影响的问题,提出了一种半监督主题模型。提取图像中与位置无关的局部特征,用尺度不变特征变换对特征进行描述,用词袋模型将人脸图像表示成一组视觉单词的集合;在基于隐含狄利克雷分配(latent Dirichlet allocation, LDA)方法中的主题-单词层分布上引入少量的类别标记指导未标记样本的分类的基础上提出半监督隐含狄利克雷分配方法。在多姿态人脸判别任务上的测试结果表明该算法比无监督LDA算法分类率高9.0%~24.7%;对于部分遮挡人脸图像、未对齐的人脸图像的分类率比多姿态主成分分析法分别提高8.8%和21.5%~39.8%。结果表明该方法在少量样本标记的情况下,性能逼近有监督的隐含狄利克雷分配方法,且适用于其它图像分类问题。  相似文献   

4.
数据动态性在设计推荐算法过程中不能忽略。针对大多数传统型静态文本建模方法主要基于可交换性的基本假设,对数据在协变量空间上的依赖关系有所忽略的问题,本文提出了一种新的主要基于函数式DPM模型过程动态推荐模型。该模型对传统DPM混合模型在动态数据建模方面的问题进行了改进。创建了相关狄利克雷过程的参数与协变量空间联系,且狄利克雷过程仍然属于边际分布。应用函数式狄利克雷过程,可针对产生、消失以及参数改变的混合模型组件进行有效建模,并可作为动态先验融入非参数混合模型。仿真实验结果表明,与应用传统狄利克雷过程做先验的话题模型相比,本文算法优势更加明显。  相似文献   

5.
针对传统LDA主题模型无法体现词与词之间的顺序及关联性这一不足,提出一种改进的加权W-LDA情感分类方法.首先,在该模型的主题采样及其分布期望计算过程中引入平均加权值,以此避免与主题紧密相关词被高频词所淹没,从而提高主题间的区分度; 然后,以提取到的高质量文档-主题分布及主题-词向量为基础,引入支持向量机算法(SVM),构建一个集有情感词分析与提取、主题分布计算与情感分类功能的文本语料情感分析方法; 最后,利用真实的教学评价数据和公共评论集对本文方法的有效性进行了验证.结果表明,本文提出的方法在主题区分度  相似文献   

6.
为了解决传统的深度学习模型会忽略语料库中全局词共现信息所包含的非连续和长距离语义的问题。本文提出记忆图卷积神经网络(MGCNN)引入注意力机制的商品评论情感分析方法。首先提取词与词、词与文档之间的关系,以全部的词和文档作为节点,将整个数据集构造成一个异构文本图。再基于图卷积网络(GCN)来构建用于图结构数据的神经网络,利用长短期记忆网络(LSTM)提取上下文相关特征,并使用注意力层获取重要特征。多组对比实验结果表明,本方法的分类效果更好,且随着训练集数据所占比例的降低,其优势更加显著。  相似文献   

7.
利用含参量非正常积分的一些性质,给出了狄利克雷积分integral from n=0 to +∞(sinx)的几种计算方法。  相似文献   

8.
如何从海量的专利信息中挖掘出不同专利之间隐含的关联关系是很多专利管理系统迫切需要解决的问题.本文从专利文本的摘要出发,提出一种基于Apriori和引入LDA主题模型的专利文本分析方法.首先,采用Apriori算法对数据降维,挖掘关键词和主题词之间的关联规则并根据规则绘制共享主题网络图,然后使用LDA主题模型对离散化的专利-主题词矩阵进一步线性降维,并将主题聚类,得到主题细分下的高频词主题,最后结合两种分析方法的结果对专利文本进一步挖掘分析.本文所使用的方法能够有效地挖掘出专利文本数据间的关联,可以为专利间的关联推荐提供思路和应用参考.  相似文献   

9.
话题发现是提取热点话题并掌握其演化规律的关键技术之一。针对社交网络中海量短文本信息具有高维性导致主题模型难以处理以及主题分布不均导致主题不明确的问题,提出一种基于LDA(latent dirichlet allocation)主题模型的CBOW-LDA主题建模方法,通过引入基于CBOW(continuous bag-of-word)模型的词向量化方法对目标语料进行相似词的聚类,能够有效降低LDA模型输入文本的维度,并且使主题更明确。通过在真实数据集上计算分析,与现有基于词频权重的词向量化LDA方法相比,在相同主题词数情况下困惑度可降低约3%。  相似文献   

10.
针对隐马尔科夫模型(Hidden Markov model,HMM)定义中状态数必须预先设定的不足,提出了一种基于狄利克雷过程(Dirichlet process,DP)和连续隐马尔科夫模型(Continuous hidden Markov model,CHMM)的滚动轴承性能退化评估方法。该方法基于DP扩展混合模型(Dirichlet process mixture model,DPMM)良好的聚类特性和分层狄利克雷过程(Hierarchical Dirichlet process,HDP)的分层共享原理,利用多组状态特征值,获得了轴承的运行状态数,解决了CHMM模型结构设置的问题,实现了滚动轴承运行中的退化状态识别和性能评估。利用美国USFI/UCR智能维护中心轴承全寿命试验进行了应用研究,并与基于Kolmogorov-Smirnov(K-S)检验的滚动轴承性能退化评估进行了对比。结果表明,结合狄利克雷过程和连续隐马尔科夫模型的算法能有效地监测滚动轴承运行中的不同退化状态,为基于状态的设备维修提供了参考。  相似文献   

11.
随着多媒体技术的不断发展,从大量图像中查询特定图像成为图像处理应用中的一个重要问题.将图片切分成为小块,这些小块经聚类后形成码字,由码字、图片和整个图片库构建LDA模型.使用SVM分类器根据LDA模型的参数进行类别检索.实验表明该方法对大量图像的检索具有良好的效果.  相似文献   

12.
从海量的在线评论中自动识别出垃圾评论,是消费者及厂家有效利用在线评论的前提。结合垃圾评论者的行为特征及评论文本内容,采用支持向量机构建了垃圾评论识别模型。实验结果表明,该方法有效地识别了垃圾评论。  相似文献   

13.
针对行车记录模糊图像的模糊核不能准确估计的问题,提出一种变分狄利克雷分布的模糊核估计方法,并利用改进的增广拉格朗日算法实现有效的图像复原。采用梯度投影法求解优化问题,提取图像边缘的精确方向,用狄利克雷分布替代模糊后验估计消除图像噪声,减少额外约束;以超拉普拉斯先验分布建模,结合ALM实现行车记录盲图像复原。实验结果表明,通过多尺度的模糊核估计,能有效估计模糊核并消除行车记录图像的噪声,恢复行车记录图像的纹理细节。与其他方法相比较,所提出的盲图像复原方法,从视觉特性和评价指标来讲都具有较好的恢复效果。  相似文献   

14.
针对传统的社区发现算法大多基于网络拓扑结构寻找独立的社区结构,忽略了用户兴趣属性,并且不能有效地发现社区间的相关性和层次关系等问题。该文提出一种新型的基于PAM(pachinko allocation model)概率主题模型的层次化网络社区发现算法,综合考虑了用户的兴趣和用户的社交网络关系,在同一模型平台上实现层次化的社区结构发现和用户兴趣挖掘,并捕捉和揭示社区之间的关联性和重叠性等特征。模型采用Gibbs采样方法进行参数推导。在真实数据集上的实验结果验证了所提出算法的可行性和有效性。  相似文献   

15.
本文用有限解析法求解了泊松方程的狄利克雷问题,证明了泊松方程狄利克雷问题的有限解析解以速度O(|h|~2)一致收敛于原问题的解。  相似文献   

16.
朱玉洁 《商品与质量》2011,(S5):177-178
在线评论作为信息的主要来源,对商业银行的产品产生重大影响。关于产品在线评论的研究已经很多,但商业银行产品仍然是个空白。本文提出一个商业银行在线评论的影响效用模型,除了评论内容的质量、极性,本文将评论标题、评论与反馈一致性引入模型。本文首先介绍相关研究,并提出假设,然后建立理论模型。最后通过对100条在线评论做Logistic回归,验证了该模型的有效性,以及评论的标题和评论的一致性对商业银行产品销售存在的显着影响。商业银行可以据此进行评论管理。  相似文献   

17.
从评论本身的客观性、主观性、时间维度、评论者角度及网络环境考虑,结合详尽可能性模型(ELM),研究评论质量和评论时效性的中心路径以及评论数量、评论者资信度和网络环境认知的边缘路径对购买决策的影响,构建理论模型并进行研究验证.采用问卷调查的方法收集数据,利用SPSS22.0软件对问卷数据进行分析处理.结果表明,评论时效性、评论数量、评论者资信度中的评论者专业性维度和网络环境认知都是通过评论可信度作用于消费者的购买决策,信任倾向会调节消费者对高质量评论的可信度感知.  相似文献   

18.
从语义角度,对手机类产品的用户评论进行研究。通过对用户评论进行文本预处理、特征项权重计算、特征项编码和聚类等一系列处理,尝试挖掘出这些评论所包含的维度,为商家和潜在用户提供更精确、更有针对性的评论参考。  相似文献   

19.
从商品评论抽取算法出发,使用开放应用编程接口调用和链接跟踪的方法,分别设计了基于通用爬虫原理和开放应用编程接口(OpenAPI)的商品评论聚焦爬虫算法。在此基础上实现了淘宝网和京东网商品评论收集程序。最后将两者与通用爬虫算法进行比较,证实了二者的程序设计具有针对性强、数据采集实时性好、易嵌入开发等优点,为实时评论数据采集技术的研究提供了新思路。  相似文献   

20.
基于奇异值分解的个性化评论推荐   总被引:1,自引:0,他引:1  
针对如何让消费者在海量评论中快速找到自己感兴趣的评论,该文提出了一个基于奇异值分解的个性化评论推荐系统RevRecSys。该方法首先构建了用户-特征矩阵和评论-特征矩阵;然后利用矩阵分解技术把这两个矩阵压缩到隐因子向量空间;最后通过匹配用户的隐因子向量空间和评论的隐因子向量空间实现评论推荐。通过实验,验证了RevRecSys相比现有的方法,可以获得更好的推荐效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号