首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 359 毫秒
1.
为了研究在不同类型重大公共事件下实施交通管控引起的舆情差异,从网络舆情角度,构建适用于交通管控舆情分析的情感与主题挖掘协同分析模型.在模型中建立面向重大公共事件下交通管控舆情的情感词典库,基于朴素贝叶斯分类算法进行情感分析,采用LDA主题模型法进行主题挖掘.以常规公共事件与突发公共事件下的交通管控为研究对象,通过爬取微博平台网民的评论数据,对比不同类型事件下交通管控网络舆情变化差异.结果表明,常规公共事件与突发公共事件下的交通管控舆情情感值分别为0.75~0.95与0.35~0.85.不同类型重大公共事件下交通管控舆情出现消极主题词的因素更加复杂,而积极主题词的相似度更高.突发公共事件中交通管控舆情主题词的热度变化趋势在事件初期急剧上升,然后逐渐下降趋于平缓,而常规公共事件下的趋势没有明显规律.  相似文献   

2.
以相关度较高的主题网站构成的群落,其分布呈现出显著的生态学特性为理论依据,采用链接分析方法,对主题网站的评价指标以及主题网站之间的关联关系进行研究和分析,提出实用性,相似度,递减度和影响力等主题网站的评价指标,并依据该评价指标,以广度优先为原则,设计主题网站群发现的算法.结果表明,该算法是有效和可行的.  相似文献   

3.
本文论述了分布式离散事件模拟的必要性,介绍了三种重要的分布式离散事件模拟算法的基本思想:CMB 算法、Time Warp 算法和采用递归关系的算法。最后对这三种算法作了简要的比较,讨论了算法的适用范围等问题.  相似文献   

4.
针对传统社会网络链接预测方法忽视节点文本内容的问题,提出一种基于潜在狄利克雷分配(Latent Dirichlet Allocation, LDA)主题模型的协作演化链接预测算法。算法利用LDA模型,对节点的文本内容进行分析,提取出每个节点的主题分布向量,利用分布向量的点积来衡量节点文本的相似性;然后将节点文本内容相似性矩阵与节点邻接矩阵相加,在此基础上计算节点之间的相似性;最后选取相似性最高的k个节点作为预测结果。实验结果表明该算法在网络图稀疏的情况下有较好的效果。  相似文献   

5.
提出了一种面向高维资源的分布式相似资源搜索机制.针对传统的分布式对等(P2P)网络无法解决高维资源的相似性搜索问题,通过基于主成分分析的降维算法将高维资源向量模型映射到低维空间,以低维空间中资源向量模型为索引,映射到P2P网络里的分布式散列表中,以一种完全基于P2P网络和路由机制的简单有效方式实现分布式相似性资源搜索,同时避免资源维数过高引发搜索的维数灾难.对降维处理后资源相似性信息保留情况进行了分析,并通过基于内容寻址网络的仿真验证了降维算法对于构建低维资源索引的有效性.对于具有一定聚类特征的高维资源,该方法可以在分布式的相似性搜索中获得较高的查准率.  相似文献   

6.
基于立场检测和主题挖掘的突发公共事件舆情演化研究,能够帮助政府及利益相关者快速地掌握突发公共事件网络舆情的演化规律,具有重要的意义。划分具体突发公共事件的舆情生命周期,提出新的立场检测模型和主题句挖掘方法,针对每个生命周期阶段,在识别大众网民的立场信息的基础上筛选出高效用的舆情信息,再挖掘高效用舆情信息的主题,以深入分析突发公共事件主题信息的演化规律。以“杭州女子失踪案”的微博数据为例,首先将本文方法与多种方法的实验结果进行对比分析,验证了方法的有效性;然后基于实验结果进行舆情演化分析,证明了其能够在实际的突发公共事件舆情中快速聚焦关键点,较好地分析突发公共事件舆情演化规律和特点。该方法能较有效、准确地识别和分析舆情内容,为网络舆情演化的研究提供了新视角。  相似文献   

7.
针对供应链环境下制造企业基于海量感知数据的业务处理存在语义异构,同时难以进行集成和高效应用的难题,提出一种本体驱动的分布式信息处理方法.构建基于海量感知数据的供应链事件本体,完善定义和表达企业业务处理粒度,通过本体映射实现异构信息源到统一描述事实组的转换.定义并构建基于事件本体的语义规则语言(SWRL)处理规则,实现企业决策应用.提出一种规则分解和事实分发策略,采用基于MapReduce和Rete算法相结合的分布式处理架构,实现大规模数据的高效处理.通过企业实例对比分析,结果表明,以推理结果准确性和处理效率为指标,验证了该方法的可行性.  相似文献   

8.
研究了含分布式发电的配电网无功优化问题。结合传统的电容器无功补偿方法,将分布式电源作为连续可调无功源参与到配电网无功优化。针对智能算法容易陷入局部最优解的问题,引入子空间的概念,提出一种基于子空间细菌群体趋药性算法,增强了算法的全局寻优能力。利用IEEE33节点系统计算表明,分布式电源参与配电网无功优化可有效降低系统的网损,提高各节点电压,改善分布式电源并网点电压稳定性,同时验证了改进算法的有效性和可行性。  相似文献   

9.
提出一种事件约束下基于迁移学习的文本—图像特征映射算法.通过潜在狄利克莱分配方法对事件文本数据进行主题建模,并通过计算主题特征的信息增益选出最显著的文本特征;用视觉词袋模型和朴素贝叶斯方法对事件图片进行主题建模;通过同事件下的文本数据特征分布和文本—图像共现数据特征分布,实现了对图像特征分布的近似.在包含15个主题事件的数据集上进行实验的结果证明了所提特征映射算法的有效性.  相似文献   

10.
针对分布式电源接入配电网引起的电压越限和电能质量下降等问题,提出了一种具备自适应特性的分布式电源优化配置方法. 建立了光伏、风电两种典型分布式电源的数学模型,分析其功率输出特性. 构建了同时考虑发电成本、环境成本、有功网损折算成本三项指标的分布式电源优化配置模型. 针对多目标函数和多约束条件的优化配置模型,应用自适应粒子群算法求解,实现学习因子和惯性权重自适应调整以提高算法的寻优性能,由此得到分布式电源的最佳接入位置和容量. 最后,以IEEE33节点配电系统为例进行仿真验证. 结果表明,自适应粒子群算法与传统粒子群算法和混沌粒子群算法相比,求解得到的优化配置方案可达到更好的供电可靠性和经济性要求.  相似文献   

11.
对不同语言的句对齐文献资料进行分析,提出了基于多语主题模型的跨语言文献相似度的计算方法.首先,对收集整理的不同语言(中文、英文、韩文)文献构建数据模型,通过分词、分词结果修正及选择、词权重计算等预处理工作构造词项-文档矩阵.其次,建立多语主题语义空间,将译成3种不同语言的文献映射到语义空间,在语义空间中每一主题都由3种语言构成.最后,通过其语义空间中对应的主题计算比较不同语言间的文献相似度.实验结果显示,不同语言之间的文献相似度可以直接在语义空间中计算,且相似度计算的准确性在90%以上,验证了本文方法在跨语言文献相似度计算时的有效性.  相似文献   

12.
目前,跨文本集的话题发现模型(cross-collection LDA,ccLDA)只适用于各个数据源话题相似度很高的场景,而且其全局话题和每个数据源的局部话题会强制对齐,存在词语稀疏的问题。针对ccLDA模型中的不足,提出了改进的跨文本集话题发现模型(improved ccLDA,IccLDA)。该模型在采样时先判断词语属于全局话题还是局部话题,再分别进行采样,避免了ccLDA模型中全局话题和局部话题必须对齐的缺点,进而降低了词语在全局话题和局部话题的分散程度,使该模型可以适用于多数据源的场景。在公开数据集上进行了多数据源文本集的话题发现实验,并进行了话题比较性分析。实验结果表明,在设置不同的话题数时,IccLDA模型的困惑度值均低于LDA模型和ccLDA模型,表明IccLDA模型具有更优的建模能力。最后,在真实数据集上开展了进一步实验验证,证明了本文提出的改进模型不仅建模能力优于原始模型,还可以有效地发现各个数据源讨论的公共话题和每个数据源讨论的局部话题,更适用于多数据源场景的文本话题发现。  相似文献   

13.
为了提高元搜索引擎排序结果的质量,提出了成员引擎特征的主题Hub值表示和基于主题Hub值的结果排序算法.特征学习算法利用一组主题关联词对成员引擎的特征进行学习,并表示为主题Hub值的形式.排序算法根据主题Hub值计算结果的全局相关度对结果进行排序.实验结果表明,该模型取得了更好的排序质量.  相似文献   

14.
针对文献推荐问题,提出了一种基于主题效能的学术文献推荐算法,该算法使用潜在狄利克雷分布(latent Dirichlet allocation,LDA)对候选文献和用户发表的文献进行建模,挖掘出具有高效能的主题集合,并根据候选文献中高效能主题的分布情况来计算它与用户兴趣之间的相似度,最后向用户推荐有价值的文献.实验结果表明:提出的算法比基于频繁项挖掘的算法具有更高的推荐准确率和推荐召回率,可同时满足用户对个性化和文献质量两方面的需求.  相似文献   

15.
基于游程分析轮廓提取算法的改进   总被引:1,自引:0,他引:1  
指出Capson游程分析轮廓提取算法存在的两点不足:一是所提取轮廓在水平方向凹形部分存在偏差;二是未考虑合并情况会导致提取复杂图案轮廓时出现部分轮廓丢失现象.通过增加分叉点和交汇点以及建立两种未考虑合并情况对应的规则,分别对这两点不足进行改进.实验表明,改进后的算法能精确提取任意复杂图案的全部内外轮廓,在提取高游程平均压缩率图像轮廓时耗时较少.该算法能实现流水线式并行轮廓提取,减少线阵扫描相机应用中等待数据获取的时间,提高在线检测速度,且成功应用于高精度PCB线路板缺陷检测系统,实现高分辨PCB图像轮廓快速准确提取.  相似文献   

16.
以杨氏模量测定实验和线膨胀系数测定实验为基础,通过改进实现方法,即采用现有线膨胀系数测定实验的温度控制系统来精确控制待测材料的温度,测定待测材料在不同温度下的杨氏模量,作杨氏模量与温度的关系图,结果表明杨氏模量的大小与温度变化成线性关系.  相似文献   

17.
针对回顾式话题检测方法存在的话题检测时效性较差的问题,提出了改进的位置敏感哈希(LSH)算法,并应用于互联网新闻层次化话题检测. 在挖掘新闻内容特征的同时,应用潜在狄利克雷分布主题模型挖掘新闻的语义特征,将非二进制空间的内容特征向量和主题特征向量转换到二进制特征空间上,依次应用LSH算法对新闻文本基于内容特征和主题特征聚类,得到具有"主题-内容"层次的话题. 实验结果表明,该方法通过挖掘新闻的内容特征和主题特征,能更准确和完整地表现新闻内容;将内容特征和主题特征转换到统一的二进制空间,有效降低了聚类过程的时间复杂度,在保证话题检测准确率和话题在语义层面上扩展性的前提下,提高了话题检测的效率.  相似文献   

18.
针对目前的主题挖掘只考虑主题内容的概率分布方法,本文提出一种综合考虑内容、时间等因素的微博主题挖掘模型mixtureLDA. 该模型能够分析用户不同类型微博的主题概率分布和时间微博主题概率. 实验使用新浪微博数据集,结果表明基于mixtureLDA的微博主题挖掘模型能够有效地挖掘出用户微博和时间微博的主题概率分布. 与MB-LDA、userLDA模型对比,mixtureLDA模型可有效降低困惑度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号