共查询到20条相似文献,搜索用时 109 毫秒
1.
2.
网络舆情热点话题聚类方法研究 总被引:3,自引:0,他引:3
主流的热点追踪算法都采用文本聚类技术来实现,在处理海量网页时,很难精准聚合中心结果,离需要的热点差距太远.现有的网络舆情系统监控的范围受限于使用者给出的关键词,使系统无法监测使用者未知的突发事件.针对网络舆情发生和传播特点,改善舆情信息采集策略;网络舆情的相关页面标题文字主题鲜明,据此提出自动挖掘热点关键词并根据关键词进行话题聚类的方法;根据新闻、论坛和博客的不同特点分别设计网络舆情热点分析模型.在此基础上,设计并实现了一个网络舆情监测系统.系统实际运行表明,该方案可以及时发掘热点话题并对突发事件实时追踪监测. 相似文献
3.
谭娟 《计算机工程与应用》2015,51(12):118-122
针对传统模型难以真实地描述社交网络舆情话题传播过程,提出一种基于传染病模型的社交网络舆情话题传播模型。分析了社交网络舆情话题的传播特点,根据传染病动力学机制,将内部感染概率、外部感染概率、免疫概率以及直接免疫概率引入舆情话题传播过程中,构建了社交网络舆情话题传播模型,在Matlab 2012平台下采用Facebook数据集进行仿真测试。仿真实验结果表明,该模型可以准确描述社交网络中的话题传播行为特征,研究结果可以为社交网络舆论管理者提供有价值的参考意见。 相似文献
4.
舆情话题通常是由突发性的新闻事件所引发,社交网站(Social Network Sites,SNS)因其庞大的用户规模和开放性、即时性与互动性等特点,成为舆情话题传播的重要渠道.因此,研究SNS网络中的舆情话题传播机制,将有利于对舆情话题的传播过程进行分析与监控.然而传统的网络信息传播模型无法真实地描述SNS网络中的舆情话题传播过程.为了解决上述问题,分析了SNS网络中的信息互动模式及舆情话题的传播特点,基于无标度网络上的SIR模型,通过引入内部感染概率、外部感染概率、免疫概率以及直接免疫概率,构建了SNS网络中的舆情话题传播模型.仿真结果表明,基于SIR的舆情话题传播模型可以很好地描述SNS网络中的舆情话题演化规律. 相似文献
5.
6.
随着信息技术的飞速发展,互联网成为了舆情传播的主要载体.各种舆情事件不断涌现,并在网民的参与下广泛传播,由此可能引发强烈的社会反响.因此,如何实现网络舆情事件快速发现与个性化监测需求的精准推送,成为了当前舆情的重点关注内容.对于舆情场景下用户交互信息稀疏导致的兴趣难以刻画的问题,提出了一种基于层次知识的话题推荐模型.模... 相似文献
7.
8.
文章描述了一个互联网舆情搜索分析系统的设计及实现方法。系统采用互联网搜索引擎(例如谷歌、百度、雅虎等)、RSS技术、网页信息结构化抽取等技术实现了对互联网敏感信息发现以及网络舆情信息的搜索分析。 相似文献
9.
话题检测可以及时发现互联网舆情热点和突发性事件,并可对话题进行持续跟踪,从而实时掌握舆情事件动向。文中提出了一种基于聚类的改进话题检测和跟踪算法。首先,对文本的特征向量进行改进,增加了基于句子主干的主干向量。然后对每个检测到的话题提取两个中心向量,一个是基本中心向量,另一个是基于主干向量提炼的主干中心向量。在此基础上再通过计算每个文本与中心向量之间的距离进行聚类分析,保证话题中各个文本之间的内聚性。同时基于主题词抽取,在主题词的基础上计算话题之间的主题相关性,有效地实现了子话题检测功能,从而提高了话题检测和跟踪的准确性。通过对10大网站5个频道超过两周数据量的测试,结果表明此方法在一定程度上提高了话题检测和跟踪的正确率,并具有一定的适应性和推广性。 相似文献
10.
新媒体的迅猛发展,是当前舆情环境转变的重要肇因.从两个典型案例出发,探讨新媒体环境下体育舆情环境;同时还以一个采用话题识别与跟踪技术对国内体育知名论坛进行话题识别与跟踪的系统为例,探讨信息处理技术应对转变后的体育舆情环境的可能性. 相似文献
11.
12.
This work presents the development of an integrated computer and telephone‐accessed WWW system (CTW) to provide a ubiquitous web access service. The CTW system serves as an intermediary between the telephone user and web sites. The CTW system retrieves and then converts the proposed Hyper Phone Markup Language (HPML) specified web pages into speech patterns. Telephone users can access information, including form‐based transaction services, on HPML‐specified web pages using a telephone set anywhere in the world by connecting to the CTW system. Another feature of CTW is that HPML‐ specified web pages stored in cyberspace can also be accessed via regular browsers, including the current Netscape Navigator and Microsoft Internet Explorer. The CTW system provides a ubiquitous web access service for users at any degree of web‐literacy by integrating well‐installed telephone networks and the Internet. Copyright © 2000 John Wiley & Sons, Ltd. 相似文献
13.
《Journal of Network and Computer Applications》2007,30(2):466-478
Now no web search engine can cover more than 60% of all the pages on Internet. The update interval of most pages database is almost one month. This condition has not changed for many years. Coverage and update problems have become the bottleneck problem of current web search engine. To solve these problems, a new system, search engine based on DNS is proposed in this paper. This system adopts the layered distributed architecture like DNS, which is different from any current commercial search engine. In theory, this system can cover all the web pages on Internet. Its update interval could even be one day. The original idea, detailed content and implementation of this system all are introduced in this paper. 相似文献
14.
面向Web的信息收集工具的设计与开发 总被引:8,自引:1,他引:8
随着互联网的发展以及网上信息的日益丰富 ,传统的信息处理已经延伸到互联网领域。在对互联网上的信息进行处理时 ,常常要将分布在互联网各处的Web页面下载到本地供进一步处理 ;这便是所讨论的Web页面收集工具的核心功能。该页面收集系统在综合使用Web页面间的链接关系和页面内容的基础上 ,增加了多层次的页面过滤模块 ,可用来收集特定领域内的Web页面 ;同时可采用多机并行收集的方法提高页面收集的效率 ;采用大型数据库存放元收集信息 ,并对收集到的页面进行压缩 ,能够支持海量数据的收集 ;动态更新机制的实施使得下载到本地的页面信息能够得到及时的更新。 相似文献
15.
网页数据自动抽取系统 总被引:6,自引:0,他引:6
在Internet中存在着大量的半结构化的HTML网页。为了使用这些丰富的网页数据,需要将这些数据从网页中重新抽取出来。该文介绍了一种新的基于树状结构的信息提取方法和一个自动产生包装器的系统DAE(DOMbasedAutomaticExtraction),将HTML网页数据转换为XML数据,在提取的过程中基本上不需要人工干预,因而实现了抽取过程的自动化。该方法可以应用于信息搜索agent中,或者应用于数据集成系统中等。 相似文献
16.
动态网页是Internet上重要的网页类型,它们通常是由网站的后台数据库通过某种通用的模板构成.提出了一种新的基于树模型算法的动态网页信息抽取方法.它在已有算法和系统的基础上,进行了多方面的扩充.实验表明,这种基于树模型的抽取方法能够准确地定位和抽取动态网页信息. 相似文献
17.
互联网化学信息资源查询系统的设计与制作 总被引:1,自引:0,他引:1
在化学的研究和学习中为了更好地查询和利用互联网上的化学资源,需要提供一个方便、快捷的离线搜索软件。我们设计制作了“化学舵手”(Chemical Wheelman)查询系统。系统对Internet网上的化学网站进行了收索、筛选,建立了300多个国内外化学网站的离线查询系统。系统设计为全中文界面,并对国外英文化学网站进行了二级汉化与引导,达到使用方便、查询快捷、准确的目的。 相似文献
18.
Isabelle Etcheverry Thierry Baccino Patrice Terrier Jean-Claude Marquié Mustapha Mojahid 《Computers in human behavior》2012
Recent research suggests that older Internet users seem to find it more difficult to locate navigation links than to find information content in web pages. One possibility is that older Internet users’ visual exploration of web pages is more linear in nature, even when this type of processing is not appropriate for the task. In the current study, the eye movements of young and older Internet users were recorded using an ecological version of the web pages or a discursive version designed to induce a linear exploration. The older adults found more targets when performing content-oriented compared to navigation-oriented searches, thus replicating previous results. Moreover, they performed less well than young people only when required to locate navigation links and tended to outperform the younger participants in content-oriented searches. Although the type of search task and type of web page resulted in different visual strategies, little or no support was found for the hypothesis that older participants explore web pages in a more linear way in cases where this strategy was not appropriate. The main conclusion is that differences in visual exploration do not seem to mediate the specific difficulty older adults experience in navigation-oriented searches in web pages. 相似文献
19.
随着Internet的发展,基于B/S(浏览器/服务器)方式的信息管理平台逐渐成为企业信息化建设的一个新的热点。但是,网络的方便性同时也带来了非法的恶意访问和黑客攻击,造成信息的破坏和通讯的故障,给企业造成了极大的损失和威胁。网页作为Web程序的基本元素,实现它的安全性,将是最简洁和高效的解决方案。本文研究了如何在网页上加强安全的手段,提出了切实可行的新方法,进一步提高了信息系统的安全性。 相似文献
20.
随着Internet的发展,基于B/S(浏览器/服务器)方式的信息管理平台逐渐成为企业信息化建设的一个新的热点.但是,网络的方便性同时也带来了非法的恶意访问和黑客攻击,造成信息的破坏和通讯的故障,给企业造成了极大的损失和威胁.网页作为Web程序的基本元素,实现它的安全性,将是最简洁和高效的解决方案.本文研究了如何在网页上加强安全的手段,提出了切实可行的新方法,进一步提高了信息系统的安全性. 相似文献