期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

一种舆情分析中的文本分类方法

白书奎韩立新殷俊环郑晓刚张银川曾晓勤《信息技术》2013,(3):9-13

文中设计并实现了一种舆情分析中的文本分类方法。使用改进的隐马尔可夫分词方法对文本分词,结合Boosting算法生成动态停用词词库的贝叶斯文本分类方法对测试数据集分类。实验数据表明,该分类方法能取得较好的文本分类结果。相似文献

2.

基于朴素贝叶斯的文本分类算法研究

李龙昊《数字通信世界》2017,(9)

互联网时代存在大量的文本数据,为了更加有效的利用文本信息,文本分类已成为当务之急.本文介绍了朴素贝叶斯算法的原理以及解决文本分类问题的流程,分析了朴素贝叶斯用于文本分类问题的优缺点,并且提出了改进方案. 相似文献

3.

基于LDA主题模型的协同过滤推荐算法

张宇吴静《智能计算机与应用》2024,(2):190-194

传统的协同过滤推荐算法直接根据用户对物品的评分进行推荐,忽略了评论文本中隐含的重要信息,当用户对物品的评论较少时,由于数据的稀疏性会造成推荐效果的不准确和单一。本文提出了一种基于LDA主题模型的协同过滤推荐算法LDA-CF(Latent Dirichlet Allocation model-LDA-Collaborative Filtering),在传统的协同过滤算法基础上,通过LDA模型对评论文本中的主题进行分类,从各个主题层面挖掘用户的情感偏好,计算用户之间的相似度,进而向目标用户推荐商品。对京东平台牙膏的评论数据集的实验结果表明,该算法不仅可以缓解由于评分数据较少造成的稀疏性问题,推荐的精确度也有所提高。相似文献

4.

自动文本分类技术研究

祝晓鲁白振兴贾海燕《现代电子技术》2007,30(3):121-124

随着万维网的发展,文本分类成为处理和组织大量文档数据的关键技术。在阐述了文本分类算法的研究现状,分析了朴素贝叶斯(Na ve Bayes)、kNN和支持向量机(SVM)经典文本分类算法之后,提出了应用最小二乘支持向量机(LSSVM)算法来实现文本分类。对使用用最小二乘支持向量机和一般支持向量机的文本分类结果进行了比较,并得出了结论:使用最小二乘支持向量机进行文本分类缩短了文本分类的时间,并保证了一定的召回率和准确率。相似文献

5.

大数据环境下基于云计算的图书馆用户信息挖掘技术研究

《现代电子技术》2019,(21):36-40

为了应对大数据环境下图书馆个性化信息服务的发展趋势,提供更加精准的用户服务,构建基于Hadoop云计算平台的图书馆数据挖掘系统,并设计一种新型混合决策树算法。首先,设计包含4个层次的数据挖掘系统架构。然后,在算法层提出一种采用混合策略的决策树算法,该算法结合分布式改进的SPRINT算法和并行化的朴素贝叶斯算法,以便满足HDFS和MapReduce的运作方式,从而能够在Hadoop平台上进行实现。Hadoop集群环境的用户信息测试结果表明,相比单一的SPRINT算法和朴素贝叶斯算法,提出的新型混合决策树算法具有最佳的数据挖掘分类性能。相似文献

6.

基于支持张量机的文本分类研究

《信息技术》2016,(9)

传统文本分类算法通常以词作为特征,将文本数据映射到一个高维向量空间进行训练。本文则采用支持张量机(STM)进行文本分类,以二阶张量为例,将文本映射到张量空间进行运算。该算法有效降低了数据特征维数,因此更加适合小样本数据的学习。相关实验也证明,支持张量机在处理小样本问题与数据偏斜问题方面更具优势。相似文献

7.

基于属性选择法的朴素贝叶斯分类器性能改进

焦鹏王新政谢鹏远《电讯技术》2013,53(3):329-334

为提高朴素贝叶斯(Naive Bayesian)分类器的分类准确率,对朴素贝叶斯属性选择算法及假设属性概率值先验分布中的参数设置问题进行分析,提出将属性先验分布的参数设置加入到属性选择的过程中,并研究当先验分布服从Dirichlet分布及广义Dirichlet分布情况下的具体调整步骤。以UCI数据库为例进行仿真实验,结果表明当先验分布服从广义Dirichlet分布时,该方法可提高分类的准确率,如Parkinsons数据集,效率可提升13.32%。相似文献

8.

中文文本分类系统的设计与实现

王俊英郭景峰霍峥《微电子学与计算机》2006,23(Z1):262-265

文章介绍了中文文本分类系统的基本过程及其关键技术,比较和分析Rocchio、朴素贝叶斯(NB)、kNN三种文本分类算法的分类原理,提出了中文文本分类系统的结构模型,并给出了评估方法和实验结果,测试结果表明KNN算法的分类效果最佳。相似文献

9.

面向新闻文本的分类方法的比较研究

韩家新刘测《智能计算机与应用》2018,(5):38-41

文本分类是根据文档内容将文档分类为预定义类别的过程.文本分类是文本检索系统的必要要求,文本检索系统响应用户的查询检索文本,而文本理解系统以某种方式转换文本,如生成摘要,回答问题或提取数据[1].本文中将运用朴素贝叶斯、支持向量机、K最近邻、fastText这4种方法来进行新闻文本分类,并比较了各种算法的分类性能、复杂度等方面的优缺点,最后评述了精确度和时间2种分类器常用的性能评价指标[2]. 相似文献

10.

一种基于关键向量的文本分类模型

赵博丁华福《信息技术》2007,31(12):122-124

研究了基于向量空间模型的自动文本分类算法，在对现有分类算法原理深入分析的基础上，针对现有算法的不足，引入了关键向量的概念，提出了一种基于关键向量的文本分类算法，并给出了基于该算法的实验数据。相似文献