首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 875 毫秒
1.
王臻皇  陈思明  袁晓如 《软件学报》2018,29(4):1115-1130
随着微博的发展,其影响力日益增大,对微博主题内容进行分析具有重要的价值.主题模型技术能够从文本数据中提取主题,但是,由于微博文本短、随意性大、信息量小等特点,微博主题的分析具有一定的难度.提出了一个微博主题可视分析系统,利用多种互相关联的视图与丰富的交互手段,支持用户对主题模型结果进行分析与探索.系统结合了微博数据的特点,引入微博用户与时间因素,支持分析者从多角度对微博主题进行全面分析.系统支持用户在主题可视分析的基础上,通过交互操作对主题进行编辑,从而改进主题模型,提高模型的准确性和可靠性.案例分析结果表明,提出的系统可以有效地帮助用户分析微博主题和修正主题.  相似文献   

2.
医保欺诈造成严重经济损失,对医保制度的安全稳定造成巨大冲击.然而,现有工作难以支持对多类欺诈行为的联合分析和探索.基于多维时序相关的医保数据,提出面向医保反欺诈的联合可视分析方法.该方法支持医保数据的时空多角度过滤,以更快地定位欺诈;并通过不同类别、不同主体的欺诈之间的关联分析,挖掘出隐蔽的欺诈行为;与医保领域专家合作,设计并实现一个面向医保反欺诈的可视分析系统MedicareVis,通过真实医保数据上的实例研究与专家访谈,证明该方法在帮助检测欺诈行为关联上的有效性和实用性.  相似文献   

3.
中华中医药是传统文化宝库,研究及继承中医医案是更好地对其内容进行传承与创新的方式之一.提出中医病案可视分析方法,对多变量、多模态时变病案数据和药物对应的现代医学症状高维数据进行分析.提出流图、降维图、实验室检查指标图等多关联视图和交互关联更新构成的可视分析方法,支持医学专家运用中医整体观和辨证论治理论分析病案;根据视觉感知原理设计方便对比的可视映射和交互操作,探索不同中药对应现代医学症状的相似程度,展示中西医结合辨病特点.医学专家对名医的3个不同类型肾脏病例的病案进行分析,证明提出的可视分析方法在中医传承教学、挖掘核心处方进行新药方设计等方面具有潜力.  相似文献   

4.
饮食文化是中华文明的重要组成部分,对饮食文化中八大菜系的探究有助于传承和弘扬中华文明.为了向人们进行合理的食谱推荐,提出一个可视分析系统DietVis.首先,设计一种用于表达菜系多维属性的新颖视图,帮助用户分析菜系构成特征;其次,通过对食谱的食材构成和烹饪手法等进行聚类分析,让用户可以多角度地探究食谱间的关联;并结合食谱搭配的关联规则进行推荐,以满足不同用户的检索需求;最后,通过多视图联动构建出完整的饮食数据可视分析系统,支持用户在多层面对菜系及食谱进行探索和对比分析.通过案例分析和用户评估实验,采用李克特量表对调查问卷进行分析,验证了可视化视图的有效性以及系统的实用性.  相似文献   

5.
警情数据的分析和挖掘是公安部门信息工作的核心环节,数据具有时空分布不均匀、信息记录高冗余和文本内容难关联等特点,导致现有信息工作中存在人工分析效率低、传统静态图表无法支持深入分析等问题.为此,提出一种交互式可视分析数据特征和事件模式的方法.首先提出一种结合多种聚类方法的Random-STRR树算法,划分出密度不同的数据簇,随机化结点最大容纳量并构建索引结构;然后结合数据分布特征和文本特征,利用杰卡德距离和皮尔逊距离分析区域内的异常情况;最后基于关键词的关联程度构建加权网络图,利用社区检测算法对其进行关联分析.此外,设计并实现警情数据可视分析原型系统——PRDVis,包含时空特征分析视图、频繁信息要素分析视图和异常信息要素分析视图.通过某城市警情数据进行案例分析和专家评估,结果证明了所提方法的可用性和有效性.  相似文献   

6.
针对火电控制过程产生的数据连续性强、复杂度高,循环神经网络模型行为与实际控制过程难以建立语义关联,不能直观地进行模型的调试、优化和语义上的分析等问题,将可视分析技术引入面向系统辨识的循环神经网络建模过程中,提出可视分析系统iaRNN.首先,通过可视化隐藏单元激活值分布与覆盖范围设计模型评估组合视图,支持内外结合多方面评价模型性能;然后,从时序关系演变和敏感性分析等角度设计可视化视图,以支持探索模型对控制参数的响应行为;最后,基于序列符号化和聚类分析提出了一种用于探索强时序依赖的实值时间序列与隐藏单元关联模式的可视化方法.使用电厂真实数据进行案例分析,验证了iaRNN在辅助用户理解模型工作机理和诊断模型缺陷方面的有效性.  相似文献   

7.
谢治海  朱敏 《计算机应用研究》2020,37(10):2945-2950
针对电影上映前后影评情感会发生较大变化,导致电影行业分析者分析影评情感对票房预测的影响具有一定难度的问题,提出一种基于影评情感类型与强度的自回归票房预测模型,并构建了面向票房预测的影评情感可视分析系统MRS-VIS。系统基于时空特征,提出一种空间插值可视化视图,并结合多种可视化经典视图,帮助电影行业分析者对一部电影在上映前后的影评情感进行多角度探索与分析。系统支持分析者在情感分析的基础上,通过交互操作对情感类型与强度进行编辑,进一步提高票房预测模型的准确性和可靠性。案例分析结果表明,提出的模型和构建的系统可以有效帮助电影行业分析者分析影评情感类型和修正情感。  相似文献   

8.
中文文本情感分析综述   总被引:5,自引:0,他引:5  
魏韡  向阳  陈千 《计算机应用》2011,31(12):3321-3323
由于主观性文本有很多应用价值,情感分析近年来引起了很多研究人员的兴趣.情感分析是对主观性文本进行挖掘与分析,获取有用的知识和信息.针对中文文本情感分析的研究现状与进展进行总结.首先按粒度层次,从词语级、语句级、篇章级三个不同粒度层次细致地介绍相关的技术,再按文本的类型,分析了产品评论和新闻评论的研究进展.接着介绍了中文...  相似文献   

9.
文本可视化研究综述   总被引:2,自引:0,他引:2  
随着海量文本的涌现,信息超载和数据过剩等问题促使了文本可视化技术的出现.文本可视化技术综合了文本分析、数据挖掘、数据可视化、计算机图形学、人机交互、认知科学等学科的理论和方法,为人们提供了一种理解复杂文本的内容、结构和内在规律等信息的有效手段.文中首先阐述了文本可视化的概念和重要性,然后按照不同可视化对象类型综述了文本可视化的研究现状,并介绍了典型的文本可视化方法与方案;最后,对文本可视化的未来研究方向进行了展望.  相似文献   

10.
现有的视角级情感分析方法难以解决单词在不同语境下“一词多义”问题,因此性能受限.针对上述问题,文中提出基于知识图谱与循环注意力网络的视角级情感分析方法.首先,利用动态注意力机制,结合双向长短时记忆网络的文本表示和知识图谱中的同义词信息,获得知识感知状态向量.再联合位置信息构造记忆内容,并输入多层门限循环单元,计算视角词情感特征,进行视角级文本情感分类.在3个公开数据集上的实验表明,文中方法分类效果较优  相似文献   

11.
写作风格是作家根据时代背景,个人成长经历,语言文化等多方面因素表现出来的写作特点和艺术表达.在文学创作中,不同的作家有不同的写作风格.有关写作风格国外很早就已经开始研究了,并有很多成功的应用,比如作者归属,情感分析,文本抄袭等.而关于神经网络写作风格的研究几乎寥寥无几.因此,论文首要提出了一种基于神经网络的双向长短时记忆Bidirectional Long Short-Term Memory(BiLSTM)的文章写作风格识别方法.从实验结果来看采用BiLSTM进行识别是有效的,且在写作风格识别上取得了很好的效果.  相似文献   

12.
分析社交媒体中关联主题在不同社会群体之间的流动模式有助于理解观点、信息和思想的传递.已有的主题流动分析的工作大多是基于主题模型的,只能通过查看包含该主题的文本来分析主题流动的原因.这些文本数据量大且结构复杂,难以分析.为了解决这一问题,使用概念对主题内部的内容进行概括,提出了基于概念的动态文本可视分析方法,用于展示主题内容的变化模式,帮助分析主题流动的原因.该方法使用流型线条展示概念流动模式,并利用基于约束的t-SNE降维算法保证相邻时间段上概念投影分布的相似性,从而保证流型线条的稳定性.为了突出展示主题内概念的异常变化模式,提出了一种异常检测技术用于定位概念剧烈变化的时间段并进行突出显示.使用推特数据集进行定性评估和案例研究,验证了所提出的可视分析方法的准确性和有效性.  相似文献   

13.
文本情感分析   总被引:40,自引:2,他引:38  
赵妍妍  秦兵  刘挺 《软件学报》2010,21(8):1834-1848
对文本情感分析的研究现状与进展进行了总结.首先将文本情感分析归纳为3项主要任务,即情感信息抽取、情感信息分类以及情感信息的检索与归纳,并对它们进行了细致的介绍和分析;进而介绍了文本情感分析的国内外评测和资源建设情况;最后介绍了文本情感分析的应用.重在对文本情感分析研究的主流方法和前沿进展进行概括、比较和分析.  相似文献   

14.
《信息与电脑》2019,(19):134-136
随着互联网和信息技术的更新升级,网络数据的收集范围和传输速度均大幅度提升,开启了信息"大数据"时代。利用网络文本大数据进行情感分析是大数据挖掘技术应用的一种常规手段,被广泛应用在不同领域中。笔者研究了基于网络文本大数据的情感分析应用方向,详细探索了基于网络文本大数据的情感分析应用研究方向、研究方法和研究前景,并对后续的研究趋势进行了预测和展望。  相似文献   

15.
大数据可视分析综述   总被引:8,自引:0,他引:8  
任磊  杜一  马帅  张小龙  戴国忠 《软件学报》2014,25(9):1909-1936
可视分析是大数据分析的重要方法.大数据可视分析旨在利用计算机自动化分析能力的同时,充分挖掘人对于可视化信息的认知能力优势,将人、机的各自强项进行有机融合,借助人机交互式分析方法和交互技术,辅助人们更为直观和高效地洞悉大数据背后的信息、知识与智慧.主要从可视分析领域所强调的认知、可视化、人机交互的综合视角出发,分析了支持大数据可视分析的基础理论,包括支持分析过程的认知理论、信息可视化理论、人机交互与用户界面理论.在此基础上,讨论了面向大数据主流应用的信息可视化技术——面向文本、网络(图)、时空、多维的可视化技术.同时探讨了支持可视分析的人机交互技术,包括支持可视分析过程的界面隐喻与交互组件、多尺度/多焦点/多侧面交互技术、面向Post-WIMP的自然交互技术.最后,指出了大数据可视分析领域面临的瓶颈问题与技术挑战.  相似文献   

16.
目前,唐诗宋词在文学角度的研究成果较多,然而采用基于超图的超网络方法对唐诗宋词进行研究的成果较少,且仅有的这种研究局限于对字频和词频的研究。采用超网络数据分析方法对唐诗宋词进行分析研究有助于探索传统文学角度无法涉及的广度,也有助于发现唐诗宋词所折射出来的文学组词规律和时代背景。因此,首先基于全唐诗和全宋词这两个古文本语料库,分别建立了唐诗超网络和宋词超网络。在构建该超网络时,将一首诗或一首词作为超边,将唐诗中的字或宋词中的字作为超边内的节点。然后,对唐诗超网络和宋词超网络的拓扑指标和网络特性,如节点超度、节点超度分布、超边节点度、超边节点度分布,进行了实验分析,旨在发现唐代诗人和宋代词人的用字、用词和审美倾向。最后,基于李白诗词集、杜甫诗词集、苏轼诗词集、辛弃疾诗词集的诗词作品构建了作品集超网络,并计算了相关网络参数。分析结果表明,唐诗宋词超网络中的最大超度与最小超度相差较大,且其超度分布近似为幂律分布,该结果表明唐诗宋词超网络的无标度特性。另外,唐诗宋词超网络的超边节点度也存在明显的分布特性,具体来说,唐诗超网络的超边节点度较多分布在20~100,宋词超网络的超边节点度较多分布30~130。并且,通过分析发现作品集超网络具有较小的平均路径长度和较大的集聚系数,该结果反映作品集超网络具有小世界特性。  相似文献   

17.
随着互联网的迅猛发展,对网络文本带有观点性内容的主观性信息的自动情感分析成为了近期Web信息处理的一个新兴研究热点.文中对英文博客文本的情感分析进行了研究.提出了以词为单位进行特征的选取,并在文本的情感分析中加入了预处理过程.使用机器学习的方法,采用电影评审文本作为语料库,选取在英文文本分类领域较好的支持向量机作为训练器,特征的选取分别采用信息增益、互信息和x2统计的方法.实验结果表明,该方法获得了较满意的结果,与传统的基于N-Gram特征选取方法及基于无监督学习的方法相比,该方法较之都有所提高.  相似文献   

18.
以文本颗粒度为视角,从情感词抽取、语料库和情感词典构建、评价对象与意见持有者分析、篇章级情感分析、实际应用五个方面对文本情感分析文献进行了梳理,并做出必要评述。指出当前情感分析系统的准确率普遍不高,进一步研究的重点在于:自然语言处理的研究成果在文本情感倾向分析中更广泛和贴切的应用;选取文本情感倾向分类的特征和方法;利用现有语言工具和相关资源,规范、快速地构造语言工具和相关资源并应用。  相似文献   

19.
为了帮助用户理解和分析搜索引擎产生的搜索数据,提出一个搜索趋势数据可视分析系统,包括数据收集与预处理、流图计算与绘制、流线生成与文字摆放以及交互式分析.以流图与文本相结合的方式呈现搜索数据,展示数据中蕴含的搜索趋势和热点;创新性地提出了流线指导下的文本布局算法,使文字能更好地贴合流图形状;此外,还提供了一系列交互,帮助用户在不同层面对搜索数据进行探索和分析.选取5个博客数据集,从紧凑性和方向一致性2个方面对可视化方法进行量化评估,并采用2个真实的搜索数据集进行案例分析.结果表明,该系统能帮助用户理解搜索数据的变化模式,发现数据中隐含的搜索趋势,并快速掌握互联网舆情信息.  相似文献   

20.
为了更好地支持不同语料源中话题的集中分析,提出一种可视化分析的方法,可将不同来源文本中相关或独立的话题进行紧密聚类,构成一幅话题全景图,实现高效地交互式话题分析。该方法首先采用相关话题建模的方法,从不同来源的文本中抽取话题,然后,提出一系列交互式的可视化方案,从不同的角度,清晰地展示每个话题的观点和话题之间的关系,使用户可以更深入地分析和理解随着时间的变化,不同来源的文本之间的关系和各自的特点。该可视化分析方案不仅是可交互的,而且能从不同的层次和粒度来表现文本话题之间的关系。最后,将该方法应用于3种来源的论文集,并与专家共同对其进行定性评估,通过对现实世界的案例研究,验证该方法的有效性和鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号