首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 162 毫秒
1.
基于链接分析的重要Blog信息源发现   总被引:2,自引:0,他引:2  
本文提出了一种基于链接分析的对Blog信息源进行量化评估的方法,在此基础之上发现重要Blog信息源,既体现了Blog信息的特点,又在一定程度上减小了作弊链接对链接分析结果的影响,能为用户阅读信息提供方便,并可望为Blog信息检索提供一种新的思路。为了证明该评估方法的有效性,本文还提出了Blog信息源重要性的评价指标,对比了重要Blog信息源量化评估方法和评价指标的评分结果,通过相关性分析,表明此方法和评价指标存在高度的一致性。  相似文献   

2.
浅议Blog在教育教学中的应用   总被引:1,自引:0,他引:1  
李宗峰  倪亚静  詹国华 《福建电脑》2007,(12):203-203,173
Blog是一种表达个人思想和网络链接、内容按时间顺序排列、并且不断更新的出版形式,它已经发展成为一种新的网络应用模式,并应用于各个行业.本文介绍了Blog在教育教学中的具体应用方法,同时也分析了Blog在教学中的优越性和局限性.  相似文献   

3.
由于通用搜索引擎的综合性,不具备面向专业的特点,所以在准确性和速度等方面存在不足。因此针对Blog这个全新领域,提出了一个面向Blog的网络爬行器算法,为Blog语料搜集以及相关Blog研究提供了方便。  相似文献   

4.
Blog自动识别与重要性分析   总被引:1,自引:0,他引:1  
介绍和分析了Blog识别和Blog重要性评估领域的相关研究工作。并且讨论了研究中存在的问题。  相似文献   

5.
Blog是近些年来发展很迅速的一种新的基于Web的信息交流技术.电子商务自诞生以来就与计算机技术紧密相连,电子商务系统是通过互联网完成的商务交易系统.通过对Blog及其相关技术和电子商务的特点的分析研究,提出了在电子商务系统的销售环节中应用Blog的新思路、技术可行性分析,以及实现企业Blog的方法.在企业的电子商务系统中应用Blog,能够提升企业的知名度、减少企业的经营风险、提高企业的知识管理能力和企业信息的数据挖掘的有效性.  相似文献   

6.
Blog文化     
文化是人类社会实践过程中所创造的物质产品和精神产品的总和,包括物质文化和精神文化.Blog是一个中立、开放、个性化的网络信息资源平台,它由个人或组织所拥有,是人们平等沟通、相互了解的一种优秀新兴媒体,正对新闻、出版、教育、传播等诸多方面产生巨大影响.Blog具有了文化的属性.  相似文献   

7.
基于LDA模型的博客垃圾评论发现   总被引:1,自引:0,他引:1  
Blog(博客)作为一种新兴的网络媒体,在很大程度上增强了互联网的开放性,Blog已经成为互联网上的主要信息源之一,这也使得Blog空间中的垃圾评论成倍增长,因此如何识别垃圾评论成为面临的重要问题。该文首先借鉴处理垃圾邮件的方法,针对Blog本身的特点,使用规则初步过滤垃圾评论,然后对剩余评论,利用Latent Dirichlet Allocation(LDA) 这种能够提取文本隐含主题的产生式模型,对博客中的博文进行主题提取,并结合主题信息进行判断,从而识别Blog空间的垃圾评论。通过实验验证,该方法可以发现大多数垃圾评论,实验取得了较好的结果,使Blog信息更加准确、有效的为用户使用。  相似文献   

8.
通过对艺术类学生在基于Blog的网络交流应用中的情况分析和研究,分析艺术类学生在通过Blog进行网络交流和学习的频率、采用的方法,以及在学习交流中遇到的问题,并就学习交流应用的内容、类型、作用等展开分析得出启示,提出当前Blog在应用交流中的不足和产生的问题,并探讨了改进意见,分析了Blog应用发展的前景。  相似文献   

9.
教育Blog是Blog技术被引入教育领域并与教育结合应用的产物。本文介绍教育Blog的基本概念,给出它的形式化定义,综述国内外教育Blog的应用现状,研究其对师范专业学生信息素养及专业成长的影响,并对教育Blog的前景作了总结和展望。  相似文献   

10.
Web挖掘是目前计算机技术领域中的研究热点,它是现代科学技术相互渗透与融合的必然结果。Blog作为一种全新的网络发布模式,在很大程度上增强了网络信息的开放性,吸引着越来越多的网络用户。首先介绍了Blog的概念,阐述了Blog的三大核心技术:RSS、TrackBack Ping和Permalink。随后讨论了Web数据挖掘的概念及其分类,最后重点论述了把Web挖掘和Blog的三大核心功能有机结合在一起,能使Blog的价值得到更加充分的体现。  相似文献   

11.
随着博客信息源成指数级的增长,在博客空间中的信息检索,知识发现等任务正面临着巨大的挑战.博客特有的格式为以博客为载体的数据挖掘任务带来不便.本文提出挑选最具代表性的m个博文构成的博文集对博客兴趣建模,挑选的标准保证博文集中博文的重要性和主题多样性,并根据这两个指标来构造博文评估函数,将其转换成实例选择优化问题求解.实验以博客分类为目标,表明通过本文方法预处理后的博客,能够降低时间复杂度,提高分类准确率.  相似文献   

12.
一种适应短文本的相关测度及其应用   总被引:3,自引:1,他引:2       下载免费PDF全文
针对博客社区和BBS论坛充斥Web垃圾信息的问题,提出相关度向量空间模型cVSM,并以此作为评论的特征,采用支持向量机分类算法自动识别垃圾评论。cVSM包括一种适合短文本的相关测度,用于衡量评论和文章的语义相关程度。在中文博客测试集和中文BBS测试集上的实验结果表明,相比纯粹使用评论文本特征的方法,应用该模型时F1至少提高6%。  相似文献   

13.
Hierarchical OLS regression of survey results from a random sample of 312 women bloggers reveals a statistically significant positive relationship between need for self-disclosure and seeing blogging as a way to express one’s own voice, mediated by need for affiliation and time spent blogging. In essence, women with a strong need to self-disclose information about themselves are more likely than other women to say they blog to express their own voice in the blogosphere, compared with blogging to connect with other people or to gain influence in the blogosphere. In contrast, for women who blog to connect with other people or gain influence in the blogosphere, the strongest predictors is time spent blogging, not needs that motivated them to blog. Results are discussed in relation to need theory.  相似文献   

14.
现有的博客文章分类的研究通常直接沿用传统文本分类方法,并没有结合博客自身的特点。研究基于文章要素的影响分析实现分类效果的改进。提出了一种简单的博客文本去噪方法,以保证博客数据的可靠性;提出了基于博客标签的中文词库扩展方法,用于改善中文分词效果,以提高博客分类的准确性;根据综合评价模型G1法计算博客文章中标题、标签、类别、首段、末段以及正文等文章要素的权重,分析它们对博客分类的影响。实验结果表明,研究提出的方法比传统的TFIDF方法有更好的分类效果。  相似文献   

15.
范纯龙  夏佳  肖昕  吕红伟  徐蕾 《计算机应用》2011,31(9):2417-2420
博客作为一类重要的网络信息资源,其评论信息抽取是舆情分析等研究工作的基础。总结了当前主流的博客评论抽取算法,介绍了页面结构在信息抽取中的应用,并结合人理解网页时充分利用“首页”等指示性短语的特点,提出利用具有明确语义和功能指示作用的功能语义单元来抽取评论信息的技术;详细介绍了抽取过程中涉及的页面结构线性化、功能语义单元识别、正文识别和评论抽取算法等内容。最后,通过实验证明,该技术在博客的正文和评论信息抽取上能取得良好效果。  相似文献   

16.
基于贝叶斯方法和信息指纹的博客评论过滤   总被引:1,自引:0,他引:1       下载免费PDF全文
博客的出现丰富和改变了网络的内涵,影响了人们的信息传递方式,同时博客评论作为一种交互方式在博客中广泛存在,给信息监管带来了新的问题。通过分析现有的博客过滤系统,将广泛应用于文本过滤的贝叶斯方法应用到博客评论中,针对博客评论中广泛存在的广告机器人特点,结合信息指纹对其进行识别和过滤。同时对影响博客评论过滤效果和执行速度的指纹函数进行了分析讨论和实验对比,实验结果表明基于贝叶斯方法和信息指纹相结合的博客评论过滤是行之有效的,而且相对于单独的贝叶斯方法更有利于提高系统运行效率和发现广告机器人现象。  相似文献   

17.
In the blogosphere, there exist posts relevant to a particular subject and blogs that show interest in the subject. In this paper, we define a set of such posts and blogs as a blog community and propose a method for extracting the blog community associated with a particular subject. The proposed method is based on the idea that the blogs who have performed actions (e.g., read, comment, trackback, scrap) to the posts of a particular subject are the ones with interest in the subject, and that the posts that have received actions from such blogs are the ones that contain the subject. The proposed method starts with a small number of manually-selected seed posts containing the subject. Then, the method selects the blogs that have performed actions to the seed posts over some threshold and the posts that have received actions over some threshold. Repeating these two steps gradually expands the blog community. This paper presents various techniques to improve the accuracy of the proposed method. The experimental results show that the proposed method exhibits a higher level of accuracy than the methods proposed in prior research. This paper also discusses business applications of the extracted community, such as target marketing, market monitoring, improving search results, finding power bloggers, and revitalization of the blogosphere.  相似文献   

18.
基于语义理解的中文博文倾向性分析   总被引:3,自引:0,他引:3  
何凤英 《计算机应用》2011,31(8):2130-2133
博客作为一种大众化的信息及文化载体被越来越多的人所接受,博客文本的情感倾向性分析也逐渐成为信息挖掘领域的热点。目前,文本倾向性分析的研究大都围绕普通文本、新闻评论进行,针对博客文本的特点,提出一种基于语义理解的博客文本倾向性分类方法。首先以HowNet情感词语集为基准,构建中文基础情感词典,并用中文词语相似度方法计算词语的情感权值,同时分析语义层副词的出现规律及其对文本倾向性判断的影响,最后利用博主的语言风格因素对倾向性结果进行修正实现博文的情感分类。实验表明,该方法能有效地判定博客文本情感倾向性。  相似文献   

19.
受NW小世界网络模型和BA无标度网络模型的构造方法的启发,提出一种基于优先连接增长的NW小世界网络模型用于模拟博客网络,该模型具有NW小世界网络的小世界特性,其增加的度分布也满足幂律分布.考虑到在实际博客网络中各种影响博主被链接的因素的存在,对模型进一步修改,在其基础上加入了知名度.最后以科学网博客为例,通过统计分析其中的博主好友信息,进行实验仿真,结果表明所提的模型能够真实地模拟科学网博客的网络拓扑.  相似文献   

20.
为了充分利用博客日志所提供的信息,提出了建立中文博客搜索引擎的基本思路.通过对博客的技术特点和博客搜索引擎工作原理的分析,设计了中文博客搜索引擎的系统结构.在此基础上,利用规则定义和正则表达式,结合真正简易聚合技术对传统的网络爬虫进行了改进,较好地解决了博客信息难以被收录的问题.利用真正简易聚合技术对博客信息进行格式化处理,加快了博客信息采集速度.通过对中文分词的扩展,利用Lucene.net全文搜索工具实现了一个中文博客搜索引擎.实验测试结果表明,采用的方案和技术是可行的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号