首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
BBS中主题发现原型系统的设计与实现   总被引:3,自引:1,他引:3  
BBS论坛已经成为人们获取信息、发表言论的重要场所,它由论坛注册用户所发表的大量主题组成。论文针对传统的BBS论坛中有影响力主题计算方法的不足,通过计算词语在回帖传播链上的影响力,提出了一种根据对有影响力词语聚类的方法发现BBS论坛中具有影响力的主题。它能够使用户和论坛管理人员及时、准确和方便地提取重要的主题信息。  相似文献   

2.
3.
一种中文微博新闻话题检测的方法   总被引:3,自引:3,他引:3  
微博的迅猛发展带来了另一种社会化的新闻媒体形式。提出一种从微博中挖掘新闻话题的方法,即在线检测微博消息中大量突现的关键字,并将它们进行聚类,从而找到新闻话题。为了提取出新闻主题词,综合考虑短文本中的词频和增长速度而构造复合权值,用以量化词语是新闻词汇的程度;在话题构造中使用了上下文的相关度模型来支撑增量式聚类算法,相比于语义相似度模型,其更能适应该问题的特点。在真实的微博数据上运行的实验表明,本方法可以有效地从大量消息中检测出新闻话题。  相似文献   

4.
基于BBS语料的话题提取主要是从大量的BBS论坛讨论信息中,将正在或近期讨论的各种话题提取出来.在自主开发的一套话题提取系统中采用了一个原始聚类算法,能够对真实的BBS语料进行有效话题提取.随后将语料中的关联信息引入到原始聚类算法中进行改进,提高了算法的性能,取得了良好的效果.  相似文献   

5.
提出一种基于状态自动机的突发特征检测算法,针对微博数据长度小,语言不规范,噪声大,数据量大的特点,优化预处理过程和状态自动机模型参数;提出一种突发话题聚类算法,对特征词的词频向量表示进行改进,并引入基于词激活力(WAF)的词法特征,使得聚类效果更加准确,得到的突发话题可读性更强.最后通过实验方法验证了算法的可行性.  相似文献   

6.
李忠俊 《计算机科学》2012,39(12):241-244
针对当前外部舆情系统中响应速度慢、准确度不高等问题,提出基于话题检测与分类的内部舆情监测系统, 给出了该系统的组织模型、数据结构与运行流程;采用内外结合的频谱话题检测法来发现当前关注的热点,应用话题 聚类预测模型对当前热点话题的可能发展趋势进行预评佑,并采取相应措施。实验证明,该系统具有较好的典情预警 能力和较快的响应处理速度。  相似文献   

7.
基于LDA模型的BBS话题演化   总被引:1,自引:0,他引:1  
BBS(论坛)作为一种新兴的网络媒体,是网民获取信息和发表评论的主要渠道之一。怎样组织BBS上的话题,发现和跟踪新话题以及话题的演化成为了研究的热点。传统的方法更多的是去检测和跟踪话题,而没有考虑话题的演化。提出了基于LDA模型的话题演化方法,表示话题在时间上的演化情况,发现热门话题和冷门话题,能更好地指导网民了解正在发生的事情。实验证明有很好的效果。  相似文献   

8.
针对目前BBS信息爬取时网页噪声严重的特点,研究BBS信息抽取的实现。应用ITTML Parser平台以及正则匹配技术,实现BBS信息的抽取、存储。设计建立了包含网页抽取模块、网页解析模块、数据库存储模块组成的信息抽取系统。实验结果表明,此方法能有效抽取BBS信息,减少网页噪声的干扰。  相似文献   

9.
在微博热点话题发现中,微博文本短、词量少、时效性高,传统的话题检测方法不再适用。针对这些新的特点,提出一种基于微博文本和元数据的话题发现方法。首先利用微博发布时间、用户信息、微博转发评论等元数据构造描述微博词汇能量的复合权值,进而提取出话题的主题词汇,然后基于上下文关系构造主题词汇簇,最后对微博文本进行二次聚类,从而得到微博中的隐含话题以及相关微博文本。在真实微博数据上的实验表明,该方法能有效发现热门话题,提高话题检测的准确率和查全率。  相似文献   

10.
根据话题检测任务的定义和特点,本文分析了传统的增量聚类算法和K-means算法的优缺点,提出了基于话题检测的自适应增量K-means算法,设计了话题检测实验,实验结果证明了该算法提高了话题检测性能,具有良好的应用前景。  相似文献   

11.
为方便利用网上资源,实现有关专题信息的快速建库和服务,文章在WEB源码规律性分析的基础上,设计实现了一个基于WEB的专题信息建库系统,并详细介绍了系统的基本思想和具体实现步骤。  相似文献   

12.
移动互联给人们带来便利的同时,也引入了许多安全风险。针对特定业务的安全防护,因为业务协议单一,业务访问量不大,流量分析及非法协议识别等技术手段可有效检测出网络攻击。采用主流的网络抓包手段,基于nDPI深度报检测技术,设计并实现轻量级的入侵检测与防御系统。测试结果表明,该系统可以通过流量检测出异常协议,并追溯到相应终端,从而进行异常终端响应处置,阻断从终端发起的异常连接,从而达到入侵防御的目的。  相似文献   

13.
介绍基于日志分析平台的监控系统的设计与实现。针对复杂软件系统的监控点类型多样、监控点数量多、监控点易变化、监控数据量大等问题,提出一种基于日志分析平台ELK的监控系统的设计与实现方法。通过对日志分析平台ELK进行改造,把日志处理中的收集、存储、索引、搜索、分析方法引入到监控系统的设计与实现中,解决了传统监控方法存在的问题,为监控系统的设计提出了新的思路。  相似文献   

14.
针对高考咨询问题重复性高、搜索引擎回答较为冗余等现状,从各网站的半结构化以及非结构数据中抽取知识三元组,构建高校信息知识图谱;对涉及多种约束的复杂问句的问答方法进行研究,提出一个基于语义解析的问答模型,通过对问句的解析将问句自动转换为Neo4 j查询语句.实验结果表明,该系统能较为准确地回答大部分领域问题,为其他领域类问答系统的实现提供了借鉴.  相似文献   

15.
针对目前多数故障检测系统缺乏实时性和高精度,以Android为平台,设计一个基于小波包分解的嵌入式机器声音信号故障检测系统。介绍故障检测系统的总体框架。围绕声音采集、预处理和故障判断三个功能模块,阐述系统在实现过程中的一些关键算法,实现声音信号的去噪处理和故障特征提取。实验分析结果表明,该系统运行简便可靠,具有一定的适用性和实用价值。  相似文献   

16.
基于模板匹配算法高速运动分析系统设计与实现   总被引:4,自引:0,他引:4  
本文提出了一种改进的模板匹配算法的高速运动物体分析方法,并构建了相应的分析架构。通过对高速车辆碰撞试验的结果分析,可以看出本算法在点跟踪处理中,在精度和容错性方面都能够得到比较满意的结果。  相似文献   

17.
分析消费行为,挖掘消费因素之间关联关系,可以辅助指导生产和销售企业的管理和决策。针对海量消费数据引起的内存不足问题,对数值型数据进行离散化,以数据库关系表为频繁模式树存储结构,并建立高效索引,实现频繁模式树中节点快速检索,最终采用Oracle数据库存储过程实现FP_Growth算法。以B/S体系结构,实现了基于关联规则的消费行为关联分析系统,并取得很好应用效果。  相似文献   

18.
双机设计是提高系统可靠性的一种方法。本文首先简要介绍了NETBIOS的概貌,网络控制块,命令和调用、接着论述了基于NETBIOS通信的双机系统的设计思想。特别地对会话创建,双机同步与故障判定,状态的切换与数据一致性的实现作了详细研究。  相似文献   

19.
分析了网上信息报送的特点,介绍了基于Web的网上直报系统的设计与实现,同时对系统的开发模式、框架、功能模块和主要的关键技术进行了研究.  相似文献   

20.
针对某肥料生产企业产品质量评价方式耗时、低效等问题,构建基于Java平台的近红外光谱实时分析系统。结合实际生产需求与近红外光谱技术的原理,对系统整体架构进行设计,并通过需求分析、系统设计、关键技术实现等过程,开发出近红外光谱实时分析系统,进行产品成分预测。可实现光谱数据采集、计算分析和结果实时输出功能,用户界面简洁直观。通过硅胶的吸水性实验,验证了预测分析结果的准确可靠(产品成分预测值对真实值的决定系数为95.13),满足生产要求,具备较大应用前景和商业潜力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号