排序方式: 共有61条查询结果,搜索用时 15 毫秒
31.
32.
中文文本倾向性分类技术比较研究 总被引:3,自引:1,他引:2
随着近几年互联网的发展,网络评论数量正日益增加。对这些网络评论进行挖掘和分析,识别出其中的情感倾向,可以给用户、企业、政府提供重要的决策支持。采用机器学习方法中的朴素贝叶斯和支持向量机分类模型,根据不同的停用词表、特征选择方法、特征加权方法的组合,对中文文本倾向性分类进行了研究。结论表明,采用保留情感信息相关词性的停用词表,以文档频率为特征选择方法,并应用基于绝对词频的支持向量机分类模型,能取得较好的分类效果。 相似文献
33.
文章在分析手机安全现状的基础上,简要阐述了J2ME技术和基于特征码的扫描技术,设计了基于特征码的智能手机杀毒软件方案,最后对KVM虚拟机上的手机杀毒软件系统进行了测试与分析。 相似文献
34.
多级内码理论是一种新型的汉字处理理论,其独特的优点使其具广阔的发展前景。录音和人工方式一直晃信息台不可逾越的障碍。基于多级内码的信息服务系统,巧妙地运用了MMC理论,解决了这方面的问题,填补了国内外空白。本文介绍了多级内码的分词方法的应用,以及信息服务系统的组成和功能,说明了系统的发展前景。 相似文献
35.
首先介绍了网络突发热点事件的生命周期,并通过定义“浏览-回复”模型,分析了网络突发热点事件的内在发展规律,指出研究网络突发事件分布规律时,必须排除网民在线人数不同带来的影响,在此基础上将网络突发事件分为独立事件和连锁事件,分别对其热度分布进行了研究,提出了独立网络突发事件热度分布的泊松分布模型,并将连锁事件的热度分布总结为多次泊松分布的叠加,最后通过具体事件介绍了拟合方法,验证了猜想。 相似文献
36.
基于主题相关性分析的文本倾向性研究 总被引:5,自引:2,他引:3
随着互联网的普及和电子商务的快速发展,网络评论、论坛讨论已成为人们网络生活的重要部分,并影响着社会舆论导向。如何识别网络评论对敏感主题(色情、法轮功等)的主观倾向性,把握网络舆情的正面或负面导向性,已成为信息安全领域研究的重要课题。文章以网络评论(影评)为研究对象,提出了一种分析文本语义倾向性的新模型,与传统倾向性识别系统不同的是,文章通过分析倾向性词汇与文本主题的相关性来研究文本的总体语义倾向。实验表明,新模型的判别准确率在80%以上,具有良好的应用前景。 相似文献
37.
38.
针对目前应用于搜索引擎Lucene的中文分析器的分词不符合汉语习惯的现状,根据正向最大匹配切分算法和采用包括基本标准中文词语的词库,实现了自己的分析器。该分析器的分词结果更符合汉语的习惯,并且在分词、建立索引等方面的性能非常接近基于机械分词的分析器,另外在检索速度方面性能提升了2~4倍,在检索召回率方面性能提升了59%。 相似文献
39.
随着互联网的快速发展,网络论坛已经成为了网络时代的重要组成部分,在论坛中,主题帖固然重要,然而多数人都是通过对所关心的主题帖进行回帖来表达自身的观点,因此论坛中的回帖往往更能反映出社会的舆论倾向。以论坛回帖为研究对象,提出了一种结合论坛回帖的特点的倾向性分析系统,相比传统的倾向性识别系统,该系统通过分析回帖文本所在的楼层结构以及文本倾向性来研究回帖的语义倾向。实验表明,新系统的判别准确率在80%以上,具有良好的应用前景。 相似文献
40.