首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
针对评论中蕴含的商品特征数目繁多且同一特征具有多种不同描述的情况,提出一种基于语义相似度的商品特征聚类算法。算法包括"分配"和"转移"两个过程。"分配"过程对特征词进行聚类得到初始簇序列;"转移"过程依次遍历初始簇序列将簇内可能存在的与其他簇语义相似度更高的特征词转移到对应的簇。实验结果表明该算法聚类质量高、时间复杂度小且对数据输入次序不敏感。  相似文献   

2.
用户评论中产品特征的抽取及聚类   总被引:1,自引:0,他引:1  
在用户评论中蕴含了大量的产品特征和用户对这些特征的观点和态度.本研究提出了基于Apriori关联规则算法的产品特征抽取方法,利用与种子特征集合的互信息和与观点词的共现度对候选特征进行过滤;并提出了一种特征自动聚类方法,以特征词间的字符串相似度和语义相似度以及特征所对应的观点词作为衡量产品特征之间关联程度的特征,采用K-means聚类算法对产品特征进行聚类.本研究采用大众点评网对美食店铺的评论语料,对该方法进行了数据实验,实验结果初步验证了该方法有效性.  相似文献   

3.
中文网络评论的IT产品特征挖掘及情感倾向分析   总被引:1,自引:0,他引:1  
为探索中文客户评论中的IT产品特征及相关情感倾向的挖掘,帮助IT生产商和服务商提高改进产品和服务质量,提高竞争力。该文将采用情感分析技术,提出基于客户感知价值的产品特征挖掘算法,实现对于评论中IT产品特征及其情感倾向的语义分析、动态提取和综合信息挖掘;并根据用户的关注权重将产品特征和情感倾向进行排列。采用从互联网下载的真实IT产品评论语料中进行实验,初步验证了该方法的有效性。  相似文献   

4.
中文评论中产品特征挖掘的剪枝算法研究   总被引:2,自引:0,他引:2       下载免费PDF全文
李实  李秋实 《计算机工程》2011,37(23):43-45
针对中文网络客户评论中的产品特征挖掘问题,提出一种基于Apriori算法的非监督挖掘方法。利用Apriori算法挖掘候选特征集合,设计邻近规则剪枝算法和最小独立支持度剪枝算法,并通过实验确定邻近规则距离值和最小独立支持度。实验结果表明,这2种剪枝算法均能有效提高产品特征挖掘的查准率和查全率。  相似文献   

5.
针对专利搜索日志中同义词出现的特点,改进了词共现相似度算法,提出了一种基于专利搜索日志的同义词挖掘方法.利用专利搜索日志中同义词出现的规律挖掘同义词集的结构模板,根据这些模板抽取出候选同义词集,利用改进的词共现方法计算词汇相似度.对称共现的词对正确率达到85.66%,召回率达到78.98%,F值0.82.该方法可用于专利搜索引擎中提高专利检索的效率.  相似文献   

6.
目前产品评论挖掘问题主要分为以下四个任务:网络评论中产品特征词的挖掘;网络评论中用户观点词的挖掘;对评论观点词的极性判断和强度判断;对挖掘结果进行排名。目前国内外对评论挖掘的研究主要集中在前三个任务。  相似文献   

7.
姚冬磊  赵晓鹏  卫耀伟 《福建电脑》2010,26(3):44-44,56
针对同义词进行查询扩展的计算复杂、不准确问题,提出一种同义词挖掘算法:每个概念用上下文特征词表示,利用完全加权关联规则挖取这些记录中频繁项作为同义词集的特征词,包含这些频繁项的概念构成同义词集,并对任意两个同义词相似度进行计算。最后将获取的量化的同义词应用到贝叶斯网络检索模型中,实验表明该算法优于其它扩展算法。  相似文献   

8.
针对在线用户评论中产品特征的提取和聚类问题进行了研究,提出一种改进的SimRank算法,将情感词-特征对放入二分网中,在二分网中使用改进后的SimRank算法计算特征词之间的相似度;再通过谱聚类算法对特征相似度进行聚类,提取网络产品的特征集合。以某电脑评论为例,从中提取情感词-特征对进行研究,实验结果显示,改进后的算法准确率更高。改进后的特征相似度检测方法可以作为检测特征相似度的有效方法。实验采用在线产品的评论语料,实验结果表明使用改进后的SinRank相似度对特征词进行聚类提取出特征更加准确。  相似文献   

9.
存在于网上商城的大量的产品评论数量在以惊人的速度增长,并成为文本挖掘研究的一个新兴热点.由于中英文语言本身的不同,我们需要将汉语评论意见挖掘作为一个单独的领域来研究.在前人研究的基础上介绍了一种新的情感分类方法,第一次提出了将主观性意见语句分为以下三类:强极性主观性意见语句,依赖上下文语境的弱极性主观性意见语句,第三类...  相似文献   

10.
面向产品评论的意见挖掘研究综述   总被引:2,自引:0,他引:2  
近年来,随着电子商务的快速发展,面向产品评论的意见挖掘研究受到国内外学者的广泛关注,成为学术界的研究热点之一.对产品评论进行意见挖掘,不仅能为用户购物提供决策支持,还可以帮助生产商对产品和服务进行改进,具有重要的研究意义.对面向产品评论的意见挖掘的研究现状进行归纳和总结.首先将该问题分为3个子任务:意见信息抽取、情感分析,意见归纳.然后基于国内外的研究进展对它们进行详细的介绍和分析.并讨论该领域其他一些值得关注的问题.  相似文献   

11.
Web 2.0 technology leads Web users to publish a large number of consumer reviews about products and services on various websites.Major product features extracted from consumer reviews may let product providers find what features are mostly cared by consumers,and also may help potential consumers to make purchasing decisions.In this work,we propose a linear regression with rules-based approach to ranking product features according to their importance.Empirical experiments show our approach is effective and promising.We also demonstrate two applications using our proposed approach.The first application decomposes overall ratings of products into product feature ratings.And the second application seeks to generate consumer surveys automatically.  相似文献   

12.
基于弱监督学习的产品特征抽取   总被引:1,自引:0,他引:1       下载免费PDF全文
伍量  何中市  黄永文 《计算机工程》2009,35(13):199-201
产品评论挖掘是从自然语言描述的用户评论中获取信息的过程,产品特征抽取是产品评论挖掘的第1个阶段,产品特征的好坏决定了产品评论挖掘中后续阶段的质量。采用弱监督的学习方法,只需要提供少量的产品特征作为种子,从这些种子出现的语句中抽取文本模式,利用文本模式来发现新的产品特征。实验结果表明,从英文文本中自动抽取产品特征的实验系统,取得了较好的效果。  相似文献   

13.
赵鄂  杨博文  杨贯中 《计算机系统应用》2013,22(10):114-118,168
针对传统的特征模型中存在的对软件产品线可变性需求表达不准确、缺乏特征描述方法的问题,在FODA等方法的研究基础上,从特征模型的层次分解、特征间依赖关系、变化性表示方法等方面进行描绘,提出一种适用于软件产品线的特征模型和特征描述方法.该特征模型能够帮助产品设计人员和开发人员正确理解产品需求,也是为后续实现软件产品线自动化生产打下基础.  相似文献   

14.
何青  孙红霞 《计算机仿真》2020,(4):456-459,475
采用当前方法检索图像中存在的特征时,检索特征所用的时间较长,检索得到的特征数量较少,存在检索效率低和召回率低的问题。提出基于堆叠乘积量化的图像特征反馈性检索方法,结合乘积量化算法和加法量化算法得到堆叠乘积量化算法,通过堆叠乘积量化算法对图像进行降维处理,去除图像中存在的冗余信息和无用数据。在亮度、色彩和梯度三个方面对降维处理后的图像进行检索,获得图像的亮度特征、色彩特征和梯度特征,实现图像特征的反馈性检索。仿真结果表明,所提方法的检索效率高、召回率高。  相似文献   

15.
一种基于语义内积空间模型的文本聚类算法   总被引:17,自引:0,他引:17  
现有数据聚类方法在处理文本数据,尤其是短文本数据时,由于没有考虑词之间潜在存在的相似情况,因此导致聚类效果不理想.文中针对文本数据高维度和稀疏空间的特点,提出了一种基于语义内积空间模型的文本聚类算法.算法首先利用内积空间的定义建立了针对中文概念、词和文本的相似度度量方法,然后从理论上进行了分析.最后通过一个两阶段处理过程,即向下分裂和向上聚合,完成文本数据的聚类.该方法成功用于中文短文本数据的聚类.实验表明相对于传统方法,文中提供的方法聚类质量更好.  相似文献   

16.
基于特征相关性的特征选择   总被引:3,自引:1,他引:3       下载免费PDF全文
提出了一种基于特征相关性的特征选择方法。该方法以特征之间相互依赖程度(相关度)为聚类依据先对特征进行聚类,再从各特征簇中挑选出具有代表性的特征,然后在被选择出来的特征中删除与目标特征无关或是弱相关的特征,最后留下的特征作为最终的特征子集。理论分析表明该方法的运算效率高,时间复杂度低,适合于大规模数据集中的特征选择。在UCI数据集上与文献中的经典方法进行实验比较和分析,结果显示提出的特征选择方法在特征约减和分类等方面具有更好的性能。  相似文献   

17.
为实现网络上非领域相关的中文产品评论信息的搜索及结构化,设计并实现中文产品评论结构化引擎,该引擎通过抓取网络上指定产品的评论,抽取评论中的特征与意见,判断意见的极型,将评论以(特征,意见,极型)的结构化形式输出给用户。其中特征意见抽取解决了产品隐形特征抽取问题。实验结果表明该引擎的特征意见召回率与准确率、意见极型判断准确率等指标可以满足用户需要。  相似文献   

18.
在负载自适应数据库系统中,负载特征化部件是关键部分,首先要对负载分类,然后根据分类的情况预测负载性能。负载的分类一般采用聚类算法,聚类算法中比较典型的就是K—means算法。但在K—means算法中,k值必须提前设定而且不能根据负载的实际情况改变,就是对算法的一个改进,使得k值动态的、能够根据负载的实际情况改变。实验结果表明,使用该算法的分类结果预测负载运行时间的准确性有明显提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号