共查询到17条相似文献,搜索用时 187 毫秒
1.
2.
通过对BBS话题模型、话题相似度、话题检测评价标准以及话题趋势的分析和研究,提出了基于内容分析的中文BBS话题检测算法:通过爬虫获取BBS信息;采用基于URL和Xpath的网页模板处理BBS信息;应用ICTLAS实现BBS信息的分词;采用Carrot2对BBS话题进行聚类,基于功率谱的热点话题分析以及基于时间序列的话题预测.最后,通过采用J2EE开发包及Eclipse 集成开发环境,结合Hibernate、GWT等技术实现了中文BBS话题检测系统,并在多个BBS论坛上进行了测试,取得了良好的效果. 相似文献
3.
4.
快速、准确获取BBS论坛主题已成为目前Web信息获取中一个极其重要的研究方向。针对已有的BBS论坛中有影响力主题计算方法的不足,提出了一种基于潜在语义分析的主题发现方法,其思想是借助计算回帖之间的相似度,综合时间、空间因素,对主题进行聚类,发现主题并加以实现。系统对BBS主题发现过程进行可视化和交互,从而更直观反映主题的变化过程,更好地验证了算法的有效性。 相似文献
5.
6.
针对目前转信功能仅限于基于Telnet的BBS的现状,提出了基于Web的BBS转信系统的设计思想,并说明了各组成模块的实现方法。该系统的工作基于NNTP,采用多线程方式提高效率,通过ODBC访问数据库实现灵活性,并使用基于IP的身份验证保证安全性。 相似文献
7.
8.
研究了特定领域的文本的信息抽取,主要考虑了文本分布的观点。首先从未标注的语料中学习主题和主题问的关系,然后把它应用在同领域的文本信息抽取。经测试,其信息抽取的效果有所提高。 相似文献
9.
针对目前BBS信息爬取时网页噪声严重的特点,研究BBS信息抽取的实现。应用ITTML Parser平台以及正则匹配技术,实现BBS信息的抽取、存储。设计建立了包含网页抽取模块、网页解析模块、数据库存储模块组成的信息抽取系统。实验结果表明,此方法能有效抽取BBS信息,减少网页噪声的干扰。 相似文献
10.
11.
基于LDA模型的BBS话题演化 总被引:1,自引:0,他引:1
BBS(论坛)作为一种新兴的网络媒体,是网民获取信息和发表评论的主要渠道之一。怎样组织BBS上的话题,发现和跟踪新话题以及话题的演化成为了研究的热点。传统的方法更多的是去检测和跟踪话题,而没有考虑话题的演化。提出了基于LDA模型的话题演化方法,表示话题在时间上的演化情况,发现热门话题和冷门话题,能更好地指导网民了解正在发生的事情。实验证明有很好的效果。 相似文献
12.
游俊慧 《数字社区&智能家居》2013,(8):5048-5050
该文阐述了采用WampServer作为服务器环境开发一个学院在线论坛的基本过程,并对采用的开发技术、论坛系统体系结构的设计、主要功能模块的实现做了具体的介绍。 相似文献
13.
14.
15.
唐伟 《数字社区&智能家居》2006,(32)
随着Internet技术的发展,论坛已成为网络上不可缺少的交流方式之一。在介绍了系统的设计目标、功能和数据库设计方案之后,结合ASP.NET的开发环境阐述了系统的实现方法。利用ASP.NET技术开发的网上论坛系统,实现了网上论坛的动态管理,使得对信息的管理更加及时、高效,方便用户及时上网浏览有用信息,发表自己对相关问题的看法。 相似文献
16.
社交网络结构错综复杂,主题社区是进行个性化推荐和商业推广的重要途径之一.然而,现有主题社区挖掘方法,要么仅基于链接关系和文本信息挖掘主题社区,要么在已划分社区的基础上挖掘主题,忽略了主题与社区的相互作用,导致社区内部话题相似度不高.因此,提出新的社区主题计算方法,进而建立一种融合主题相似度权重的主题社区发现模型(TSW... 相似文献
17.
文章给出了一种BBS监听与检测的实现方案.该系统由底层捕包,重组过滤和二次分析检索三部分分布实现.底层捕包采用winpcap以过滤大部分的无用数据.重组过滤只将论坛文本信息还原并在剔除干扰字符的基础上采用平衡二叉树进行关键字匹配进一步过滤合法文本,提高了系统性能较少丢包率.二次分析检索对捕获的非法信息进行帐密检测并根据其帐密触发安全响应. 相似文献