首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
微博社交网络是由节点构成的,每个节点代表一个微博用户。节点与节点间存在着关系,因此连接紧密的节点形成了社区。如何从微博社交网络中挖掘出社区,已成为Web2.0的团体挖掘研究热点。详细介绍了传统的网络团体挖掘算法,并提出了一种新的社区发现的算法,称为基于用户兴趣的社区发现算法。该算法不论在计算效率还是社区发现效果上比传统算法都具有明显的提升,取得了不错的实验效果。  相似文献   

2.
为在微博舆情信息高速转发时段内实现对热点数据的精准挖掘,文中设计一种基于话题标签的微博舆情热点挖掘系统。首先确定框架体系连接形式,并根据热点信息定义结果建立话题标签模型。以此为基础,对热点信息散列表进行排重处理,完成对微博舆情热点数据的处理。最后,联合采集到的目标信息样本对论坛结构进行分割处理,完成挖掘系统设计。实验结果表明,在话题标签模型作用下,系统主机对于热点数据的挖掘准确率较高,可以在微博舆情信息高速转发时段内实现对热点数据的精准挖掘,满足实际应用需求;与基于机器阅读理解的挖掘系统、基于跨语言神经主题模型的挖掘系统相比,这种新型挖掘系统能够在微博舆情信息高速转发时段内,对热点数据进行精准挖掘,与设计初衷相符合。  相似文献   

3.
《现代电子技术》2019,(7):177-180
为研究聚类算法在高校学生微博的应用情况,针对K-means算法和分层聚类算法在聚类中心选择不精确的问题,基于高校学生使用微博的背景,对微博文本挖掘应用中聚类算法的应用进行改进。通过文本的矢量表示、文本相似度计算和聚类算法的实现,验证了聚类算法在微博热门话题检测的准确性和效率,并针对实验数据提出几点针对性的措施。  相似文献   

4.
新闻节目是信息传播和舆论引导的重要载体。互联网时代,新闻数量急速增长,从海量的新闻数据中高效挖掘热点,掌握社会最新动态,成为当今媒体从业人员研究的热点。以影响力最大的34套电视上星综合频道实际新闻节目数据为实验对象,应用新闻条目智能分割技术,实现新闻报道切分,基于TF-IDF技术对新闻语音文本、新闻标题字幕内容进行关键词提取,并采用Word2vec工具实现新闻条目的向量化,并基于single pass算法实现新闻条目聚类从而拆分各个新闻话题并计算话题热度,初步实现新闻热点分析。  相似文献   

5.
贺敏  王丽宏  杜攀  张瑾  程学旗 《通信学报》2013,34(Z1):34-262
针对微博数据特征稀疏、内容碎片化的特点,提出一种基于有意义串聚类的热点话题发现方法。结合重复串计算、上下文邻接分析和语言规则过滤多种策略,提取能够表达独立完整语义的有意义串,并将微博数据建模在相对较小的有意义串空间,通过聚类产生候选话题,根据热度排序发现热点话题。微博数据实验结果表明,该方法在一定程度上实现对微博高维稀疏空间的降维,对于微博空间的热点话题发现有效可行。  相似文献   

6.
在社交网络中进行意见领袖的挖掘对信息传播与演化的深度分析、舆情监控和引导具有重要意义,本文综合结构特征、行为特征和用户的情感特征对意见领袖节点挖掘问题进行研究.本文首先对微博真实文本数据进行话题识别得到主题社区,在主题社区中基于用户节点之间的关注关系构建交互网络拓扑.然后分别从结构、行为和情感三个维度对用户的影响力进行度量.最后,分析用户在主题社区中的影响力分布与传播规律,提出意见领袖识别算法MFP(Multi-Feature PageRank).实验表明,该算法可有效地挖掘潜在的意见领袖节点,能够获得较高的支持率.  相似文献   

7.
基于A C-Tri e的在线社交网络文本流热点短语挖掘   总被引:1,自引:0,他引:1       下载免费PDF全文
黄九鸣  吴泉源  张圣栋  贾焰  刘东  周斌 《电子学报》2016,44(10):2466-2470
在线社交网络文本流中的热点短语能反映文本流中隐含的热点话题和突发事件。本文提出了一种无需分词并能支持多种热度度量函数的热点短语挖掘技术。首先用文本流的某个典型时段采样得到候选短语,构建AC-Trie前缀树。然后,基于该前缀树,单遍扫描后续的文本流,将候选短语的历史出现频率记录在Trie相应节点上,从而支持多种基于历史频率的热度计算方法。此外,为及时发现新的热点短语并减少AC-Trie的构建次数,本文通过分析Trie树各节点上的遗漏短语频率,动态确定候选短语的更新时机。新浪微博数据集上的实验验证了本文方法的有效性(准确率达89%)和高效性(时空开销仅为基准算法的2%)。  相似文献   

8.
针对现有微博网络舆情分析的研究中没有从全局层面考虑舆情文本特征的情况,结合微博网络舆情的主题及趋向性分析,提出了基于主题发现的微博网络舆情分析模型,从文本预处理、微博文本特征提取、微博舆情的主题发现及趋向性分析三方面进行了具体描述。仿真结果表明,基于该模型实现的微博网络舆情分析方法在微博网络舆情的分析处理中检测效果良好,说明该模型有效。相关内容可为该领域的进一步研究提供有价值的参考。  相似文献   

9.
针对新冠疫情期间高校疫情管控过程中所出现的舆情问题,提出一种基于词频分析与LDA模型的舆情情感分析方法。首先,从微博上挖掘与疫情防控有关的话题,采用Python爬虫爬取8219条微博留言;然后,运用情感分析与LDA模式,对正负情绪进行主题挖掘,并使用PyLDAvis进行可视化展示;最后,利用社会网络和Gephi对正面和负面的舆论影响进行相关性分析。实验结果表明,研究可为高校有效管理提供理论依据和技术支撑。  相似文献   

10.
《现代电子技术》2017,(24):28-30
针对传统的网络舆情监管预测算法对大广度、强干扰的网络舆情数据预测性能差的缺点,在深入研究现有网络舆情监管预测算法基础上提出一种基于大数据语义特征分析的网络舆情监管预测算法。该算法采用二元语义对网络舆情特征进行拟合,构建与匹配网络舆情关键词,构建时间序列模型,分析与提取语义特征,从而实现大数据分析法对网络舆情的监管预测。最后利用仿真实验对该算法进行验证,其结果表明,该算法预测精度高、实时性强,对提高网络舆情的监管能力具有重要意义。  相似文献   

11.
《现代电子技术》2016,(3):115-119
针对微博内容实时性的特点,对话题聚类的Single-Pass算法进行了改进,提出将时间参数添加到微博话题相似度检测方法中,并针对微博转发特性的处理方法给出了算法的处理步骤。仿真实验表明,该算法的优点是逻辑简单、算法执行效率高,通过算法的应用有效提高了基于Web数据挖掘的微博话题检测准确度。  相似文献   

12.
本文在综合兴趣模型研究现状的基础上,结合微博数据集对微博用户的特征进行分析,建立微博用户兴趣模型,并提出基于微博用户兴趣模型的发现算法。实验结果表明,本文提出的算法能很好的发现微博用户的兴趣,提高推荐系统的质量。  相似文献   

13.
为更好地开展微博热门话题监测工作,文中借鉴Web自动化功能测试技术,设计了一套基于WatirWebDriver的微博热度数据采集系统,实现了对微博及其热度数据的采集和处理。实验表明,系统能有效的解决传统采集方案中微博热度数据分散的问题,减轻后续分析工作压力并为其提供高质量数据素材。  相似文献   

14.
网络信息量的逐年增长,使得获取网络敏感的舆情信息并做出相应的监控处理变得十分重要,网络舆情信息挖掘技术研究十分活跃。本文介绍舆情挖掘步骤及其核心算法,分析互联网热点文件下载曲线与网络舆情发展曲线的关联,通过关联关系对互联网文件下载数据进行信息挖掘,从中找出是否存在符合曲线发展规律的热点文件,最终将文件的主题与当时的网络舆情信息进行比对,对结果进行验证,为网络舆情的监测提出了一种新的方法。  相似文献   

15.
微博文本数据高维度、同义、多义特征明显,传统基于向量空间模型(VSM)联合K-均值的热点话题发现方法存在准确率低,计算复杂,聚类中心难以确定等问题。提出一种相关向量机(RVM)优化VSM的微博文本向量化方法,首先利用RVM的自适应特征选择能力对VSM特征向量进行降维,然后利用主成分分析(PCA)方法确定K-均值算法的初始聚类中心,进而采用K-均值算法得到聚类结果,最后根据微博转发、评论和高影响力用户数量定义热度指数,热度指数最大的话题即为当前热点话题。采用实际微博文本数据集开展实验,结果表明所提方法相对于2种传统方法的准确率分别提升7.3%和1.1%,实时性分别提升45%和53%。  相似文献   

16.
本文提出了一种基于数据融合的互联网舆情分析系统.系统使用网络爬虫采集互联网新闻、微信公众号、博客、论坛、APP、微博、报纸、视频等信息,结合中国移动自有DPI数据,采用情感分析等多种自然语言处理算法实现数据融合分析处理,建立不同类型数据之间的关联关系,挖掘更多数据价值,且系统使用多租户模式实现底层数据共享和用户舆情信息隔离,大量节省硬件存储成本,也让用户体验个性化舆情.  相似文献   

17.
《信息技术》2016,(8):81-84
信息时代的发展,微信作为通信工具的同时也可以作为网络舆情传播的主要载体和平台,使信息传播更迅速,也使舆情事件的影响力增加。针对微信舆情热度的波动范围较大,并会呈现某种趋势的特点,文中提出了一种基于马尔可夫链的微信舆情热度趋势预测模型。该模型采集相关舆情的指标数据,得到热度的时间序列值;划分舆情热度趋势的状态空间;构建状态转移矩阵;预测热度的趋势变化区间。实验结果表明,该模型能有效地预测微信舆情的走势,从而为进行网络舆情管理和管理效果评估提供更有效的理论依据。  相似文献   

18.
微博是一个基于用户关系的信息分享、传播以及获取平台,庞大的微博用户群构成了一个复杂的在线社区网络,每天都有巨大的信息量在其间产生、流动、扩散,影响着人们的工作生活。通过这个网络找出重要的关键用户,无论对市场营销还是舆论控制都具有十分重要的意义。相关研究均以改进链接分析中的PageRank算法为主,然而在复杂的网络以及部分数据难以获取的情况下,这些算法并不适用。文中通过划分子网的方法降低网络复杂度,提出了一种单纯的基于网络结构的PageRank改进算法来计算用户的重要程度。实验数据分析表明,该算法简单可靠,能准确反映微博用户的重要程度。  相似文献   

19.
《现代电子技术》2019,(15):79-82
随着互联网时代社交媒体的飞速发展,热点事件不断进入公众视野,舆情分析成为公共管理部门面临的新挑战。针对该问题提出基于KPCA-粒子群随机森林算法用于舆情趋势预测研究。实验结果表明,该算法在预测精度上较BP神经网络算法有显著提高,可以为政府部门及时掌握、引导和控制网络舆情提供决策支持。  相似文献   

20.
《信息技术》2019,(3):116-120
基于当前机器学习方法在中文微博文本情感分析处理过程中的复杂性、低准确率等问题,文中提出在统计情感词的基础上,结合情感影响因子和语义规则,并加入表情特征这一重要元素,优化文本情感加权计算方法,提高情感判断的准确率。通过对爬取到的原创微博数据集进行实验分析,验证了新情感分析算法的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号