首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
针对网络舆情检测的关键技术及应用做了介绍.按照舆情监控的处理流程对网络爬虫、网页消重、网页去噪、文本分类、文本聚类等技术做了细致的介绍.对各种技术分类介绍了一些常用的算法.接着对舆情挖掘的应用方向话题跟踪与检测和情感倾向分析做了介绍.最后分析了舆情监测在理论研究和应用上的发展趋势.  相似文献   

2.
网络舆情热点话题聚类方法研究   总被引:3,自引:0,他引:3  
主流的热点追踪算法都采用文本聚类技术来实现,在处理海量网页时,很难精准聚合中心结果,离需要的热点差距太远.现有的网络舆情系统监控的范围受限于使用者给出的关键词,使系统无法监测使用者未知的突发事件.针对网络舆情发生和传播特点,改善舆情信息采集策略;网络舆情的相关页面标题文字主题鲜明,据此提出自动挖掘热点关键词并根据关键词进行话题聚类的方法;根据新闻、论坛和博客的不同特点分别设计网络舆情热点分析模型.在此基础上,设计并实现了一个网络舆情监测系统.系统实际运行表明,该方案可以及时发掘热点话题并对突发事件实时追踪监测.  相似文献   

3.
针对传统模型难以真实地描述社交网络舆情话题传播过程,提出一种基于传染病模型的社交网络舆情话题传播模型。分析了社交网络舆情话题的传播特点,根据传染病动力学机制,将内部感染概率、外部感染概率、免疫概率以及直接免疫概率引入舆情话题传播过程中,构建了社交网络舆情话题传播模型,在Matlab 2012平台下采用Facebook数据集进行仿真测试。仿真实验结果表明,该模型可以准确描述社交网络中的话题传播行为特征,研究结果可以为社交网络舆论管理者提供有价值的参考意见。  相似文献   

4.
舆情话题通常是由突发性的新闻事件所引发,社交网站(Social Network Sites,SNS)因其庞大的用户规模和开放性、即时性与互动性等特点,成为舆情话题传播的重要渠道.因此,研究SNS网络中的舆情话题传播机制,将有利于对舆情话题的传播过程进行分析与监控.然而传统的网络信息传播模型无法真实地描述SNS网络中的舆情话题传播过程.为了解决上述问题,分析了SNS网络中的信息互动模式及舆情话题的传播特点,基于无标度网络上的SIR模型,通过引入内部感染概率、外部感染概率、免疫概率以及直接免疫概率,构建了SNS网络中的舆情话题传播模型.仿真结果表明,基于SIR的舆情话题传播模型可以很好地描述SNS网络中的舆情话题演化规律.  相似文献   

5.
热点事件在发展过程中包括多个相关话题,分析多个话题在时序上的演化和传播路径,能够深层次把握热点事件产生、发展、消亡的具体细节。为此提出一种基于关联规则的热点事件时序分析方法。首先将关联规则算法并行实现获取多个时间片的频繁关键词集;然后筛选所有频繁关键词集的关联规则形成关联规则集,从而得到多个话题关键词集合;最后根据关键词集合分析热点事件多个话题的演化和传播路径。实验表明,该方法能够全面有效地跟踪热点事件的动态变化过程,为网络舆情监控和管理提供借鉴和支撑。  相似文献   

6.
随着信息技术的飞速发展,互联网成为了舆情传播的主要载体.各种舆情事件不断涌现,并在网民的参与下广泛传播,由此可能引发强烈的社会反响.因此,如何实现网络舆情事件快速发现与个性化监测需求的精准推送,成为了当前舆情的重点关注内容.对于舆情场景下用户交互信息稀疏导致的兴趣难以刻画的问题,提出了一种基于层次知识的话题推荐模型.模...  相似文献   

7.
网络舆情对政治生活秩序和社会稳定的影响与日俱增,一些重大网络舆情事件使人们开始认识到网络对社会监督发挥的巨大作用,如何实时监控舆情并及时处理尤为重要。基于此,介绍了舆情监控系统的相关技术,根据业务需求分析了系统功能模块,实现了系统设计。结果表明,该系统能有效采集、分析数据,及时发现舆情信息并实施预警。  相似文献   

8.
文章描述了一个互联网舆情搜索分析系统的设计及实现方法。系统采用互联网搜索引擎(例如谷歌、百度、雅虎等)、RSS技术、网页信息结构化抽取等技术实现了对互联网敏感信息发现以及网络舆情信息的搜索分析。  相似文献   

9.
话题检测可以及时发现互联网舆情热点和突发性事件,并可对话题进行持续跟踪,从而实时掌握舆情事件动向。文中提出了一种基于聚类的改进话题检测和跟踪算法。首先,对文本的特征向量进行改进,增加了基于句子主干的主干向量。然后对每个检测到的话题提取两个中心向量,一个是基本中心向量,另一个是基于主干向量提炼的主干中心向量。在此基础上再通过计算每个文本与中心向量之间的距离进行聚类分析,保证话题中各个文本之间的内聚性。同时基于主题词抽取,在主题词的基础上计算话题之间的主题相关性,有效地实现了子话题检测功能,从而提高了话题检测和跟踪的准确性。通过对10大网站5个频道超过两周数据量的测试,结果表明此方法在一定程度上提高了话题检测和跟踪的正确率,并具有一定的适应性和推广性。  相似文献   

10.
新媒体的迅猛发展,是当前舆情环境转变的重要肇因.从两个典型案例出发,探讨新媒体环境下体育舆情环境;同时还以一个采用话题识别与跟踪技术对国内体育知名论坛进行话题识别与跟踪的系统为例,探讨信息处理技术应对转变后的体育舆情环境的可能性.  相似文献   

11.
网络是一个非常动态的世界.每时每刻都有大量的网页加入,删除.更新.对于网络信息跟踪系统来说,需要着眼于跟踪一些固定的网页集合,同时及时地把更新的信息反应给用户.为了跟踪大量在地理上分布的网页集合,采用分布式的技术进行网络信息跟踪是非常有效率的办法.本文研究了采用分布式网络信息跟踪的各项参数特征,包括运行时的数据传输特征,分布式站点的数据负担特征,以及网络占用时间情况特征等.  相似文献   

12.
C. M. Huang  M. Y. Jang  Y. C. Chao 《Software》2000,30(13):1485-1507
This work presents the development of an integrated computer and telephone‐accessed WWW system (CTW) to provide a ubiquitous web access service. The CTW system serves as an intermediary between the telephone user and web sites. The CTW system retrieves and then converts the proposed Hyper Phone Markup Language (HPML) specified web pages into speech patterns. Telephone users can access information, including form‐based transaction services, on HPML‐specified web pages using a telephone set anywhere in the world by connecting to the CTW system. Another feature of CTW is that HPML‐ specified web pages stored in cyberspace can also be accessed via regular browsers, including the current Netscape Navigator and Microsoft Internet Explorer. The CTW system provides a ubiquitous web access service for users at any degree of web‐literacy by integrating well‐installed telephone networks and the Internet. Copyright © 2000 John Wiley & Sons, Ltd.  相似文献   

13.
Now no web search engine can cover more than 60% of all the pages on Internet. The update interval of most pages database is almost one month. This condition has not changed for many years. Coverage and update problems have become the bottleneck problem of current web search engine. To solve these problems, a new system, search engine based on DNS is proposed in this paper. This system adopts the layered distributed architecture like DNS, which is different from any current commercial search engine. In theory, this system can cover all the web pages on Internet. Its update interval could even be one day. The original idea, detailed content and implementation of this system all are introduced in this paper.  相似文献   

14.
面向Web的信息收集工具的设计与开发   总被引:8,自引:1,他引:8  
随着互联网的发展以及网上信息的日益丰富 ,传统的信息处理已经延伸到互联网领域。在对互联网上的信息进行处理时 ,常常要将分布在互联网各处的Web页面下载到本地供进一步处理 ;这便是所讨论的Web页面收集工具的核心功能。该页面收集系统在综合使用Web页面间的链接关系和页面内容的基础上 ,增加了多层次的页面过滤模块 ,可用来收集特定领域内的Web页面 ;同时可采用多机并行收集的方法提高页面收集的效率 ;采用大型数据库存放元收集信息 ,并对收集到的页面进行压缩 ,能够支持海量数据的收集 ;动态更新机制的实施使得下载到本地的页面信息能够得到及时的更新。  相似文献   

15.
网页数据自动抽取系统   总被引:6,自引:0,他引:6  
在Internet中存在着大量的半结构化的HTML网页。为了使用这些丰富的网页数据,需要将这些数据从网页中重新抽取出来。该文介绍了一种新的基于树状结构的信息提取方法和一个自动产生包装器的系统DAE(DOMbasedAutomaticExtraction),将HTML网页数据转换为XML数据,在提取的过程中基本上不需要人工干预,因而实现了抽取过程的自动化。该方法可以应用于信息搜索agent中,或者应用于数据集成系统中等。  相似文献   

16.
邵辉  李芳 《计算机应用与软件》2007,24(10):99-100,144
动态网页是Internet上重要的网页类型,它们通常是由网站的后台数据库通过某种通用的模板构成.提出了一种新的基于树模型算法的动态网页信息抽取方法.它在已有算法和系统的基础上,进行了多方面的扩充.实验表明,这种基于树模型的抽取方法能够准确地定位和抽取动态网页信息.  相似文献   

17.
互联网化学信息资源查询系统的设计与制作   总被引:1,自引:0,他引:1  
在化学的研究和学习中为了更好地查询和利用互联网上的化学资源,需要提供一个方便、快捷的离线搜索软件。我们设计制作了“化学舵手”(Chemical Wheelman)查询系统。系统对Internet网上的化学网站进行了收索、筛选,建立了300多个国内外化学网站的离线查询系统。系统设计为全中文界面,并对国外英文化学网站进行了二级汉化与引导,达到使用方便、查询快捷、准确的目的。  相似文献   

18.
Recent research suggests that older Internet users seem to find it more difficult to locate navigation links than to find information content in web pages. One possibility is that older Internet users’ visual exploration of web pages is more linear in nature, even when this type of processing is not appropriate for the task. In the current study, the eye movements of young and older Internet users were recorded using an ecological version of the web pages or a discursive version designed to induce a linear exploration. The older adults found more targets when performing content-oriented compared to navigation-oriented searches, thus replicating previous results. Moreover, they performed less well than young people only when required to locate navigation links and tended to outperform the younger participants in content-oriented searches. Although the type of search task and type of web page resulted in different visual strategies, little or no support was found for the hypothesis that older participants explore web pages in a more linear way in cases where this strategy was not appropriate. The main conclusion is that differences in visual exploration do not seem to mediate the specific difficulty older adults experience in navigation-oriented searches in web pages.  相似文献   

19.
随着Internet的发展,基于B/S(浏览器/服务器)方式的信息管理平台逐渐成为企业信息化建设的一个新的热点。但是,网络的方便性同时也带来了非法的恶意访问和黑客攻击,造成信息的破坏和通讯的故障,给企业造成了极大的损失和威胁。网页作为Web程序的基本元素,实现它的安全性,将是最简洁和高效的解决方案。本文研究了如何在网页上加强安全的手段,提出了切实可行的新方法,进一步提高了信息系统的安全性。  相似文献   

20.
随着Internet的发展,基于B/S(浏览器/服务器)方式的信息管理平台逐渐成为企业信息化建设的一个新的热点.但是,网络的方便性同时也带来了非法的恶意访问和黑客攻击,造成信息的破坏和通讯的故障,给企业造成了极大的损失和威胁.网页作为Web程序的基本元素,实现它的安全性,将是最简洁和高效的解决方案.本文研究了如何在网页上加强安全的手段,提出了切实可行的新方法,进一步提高了信息系统的安全性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号