排序方式: 共有61条查询结果,搜索用时 31 毫秒
1.
针对微博中用户影响力分析这个问题,提出用户影响力的计算方法。该方法首先提出用户自身影响力以及用户被影响力的概念,并根据用户自身特征与用户粉丝情况得出其计算公式,从而可以综合考虑用户在微博中的所有信息,计算出用户影响力。实验结果表明,这种计算方法能比较好地反映用户在其粉丝中的影响力。 相似文献
2.
文本向量化是将文本转化为向量的代数模型建立过程,在文本处理领域具有重要的应用价值,是文本数据挖掘算法的关键环节。在著名的PageRank算法基础上,提出一种基于句中词语间关系的文本向量化算法。通过引入语义层面的词语关联来克服传统的基于词频统计数据的向量化方法语义敏感度不佳的缺陷。在不同的语料测试集上的实验表明,基于句中词语间关系的文本向量化算法有更高的准确率。 相似文献
3.
近些年来,针对明文口令的破解和恢复等技术展开了广泛而深刻的研究,总的来说,该领域的主流方法已经大大提升了口令破解和恢复的成功率,但多种方法之间缺少比较和内在关联的分析。着眼于明文口令字典的生成问题,总结了近十年来主流的明文口令生成模型:马尔可夫模型、概率上下文无关模型和神经网络模型。为了有效并客观地评估这三种主流模型,设计并进行了一系列性能验证实验,给出了三种模型各自适用的场合及优缺点,并从原理层面解释了三种模型存在缺陷的原因,给出了一些优化改进的思路。最后,认为神经网络将会成为未来最具潜力的模型,并指出该领域的进一步研究和发展依赖于规范数据集的建立和多种方法的结合运用。 相似文献
4.
在情感倾向性分析领域,关于情感的收集、分析和聚合等技术一直是近年来的关注热点。该领域的相关发展带动了各个子任务及其相关研究的大力发展。本文主要综述了面向情感的信息系统中使用的情感分析相关的需求,技术,应用以及评测方法等。在情报分析方面,存在许多不同于传统的主题分析的新需求,这就是对情感分析技术的强烈需求。接着,介绍了词级、句子级、段落篇章级等不同层次的情感分析技术。然后,还综述了采用情感分析技术的各种典型应用。最后,为了工作开展的便利,讨论了情感分析领域的词库资源、样本集资源、评测方法及重要会议等。 相似文献
5.
近年来微博已经发展为一个影响力巨大的社交网络平台。针对微博的复杂网络特性,提出了对微博用户重要度的算法,从海量微博信息中智能提取重要内容。算法考虑到社交网络的节点间影响以及用户行为的传递性,同时为了提高对海量节点的处理能力,进行了有效的子网分划。通过实验,证明算法能有效分析网络中节点贡献内容的重要度,有助于提高社交网络中舆情监控、分析、管理等工作的效率和准确性。 相似文献
6.
随着互联网门户网站的崛起,以及人们在选购商品时对于互联网的依赖,人们往往会在选购商品前在网络上查找商品的评价信息。但是面对海量的评论信息,感觉无从下手,需要一种能够自动识别评价语句情感倾向性的方法。针对这种情况,陈豪,刘功申等人选定酒店、笔记本电脑、书籍这3种商品,根据商品的特殊性,提出一种基于句法分析的商品情感倾向性分析算法,这种算法的创新之处在于利用句法分析的方法获得评价对象集,并且对评价对象进行权值的分配,再利用依赖关系找到并且处理从句,以及隐含的评价对象,最后得出整句评价语句的正负面评价结果。 相似文献
7.
针对不良文本的过滤问题,文章提出了一种基于SVM分类器改进的文本过滤方法。该方法将传统的基于词语的分类方法改为基于词语元组的分类,增强了特征项的分辨率,实验表明该方法同传统的过滤方法相比具有较高的准确率和召回率。 相似文献
8.
词汇个数少、描述信息弱的缺陷,导致短文本具有维度高、特征稀疏和噪声干扰等特点。现有的众多聚类算法在对大规模短文本进行聚类时,存在精度较低和效率低下的问题。针对该问题,提出一种基于深度学习卷积神经网络的短文本聚类算法。所提算法以大规模语料为基础,利用word2vec 模型学习短文本中词语之间潜在的语义关联,用多维向量表示单个词语,进而将短文本也表示成多维的原始向量形式;结合深度学习卷积神经网络,对稀疏高维的原始向量进行特征提取,以此得到特征更为集中、有效的低维文本向量;最后,利用传统的聚类算法对短文本进行聚类。实验结果表明,所提聚类方法对文本向量的降维是可行、有效的,并且取得了F值达到75%以上的文本聚类效果。 相似文献
9.
在文本分类中,传统单标签分类问题的解决方法无法简单地应用于多标签文本分类,现有的方法通常会通过单标签问题转化思想或者多标签自身算法改进实现对多标签的文本分类。提出一种相关信息加权的自适应多标签分类算法,该算法具有相关信息加权、自适应阈值调整、权重投票相结合的特点。实验结果表明,该算法的某些性能指标优于现有一些常用的多标签分类方法。 相似文献
10.