首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 609 毫秒
1.
《软件工程师》2016,(10):9-14
使用朴素贝叶斯分类算法,结合Spark内存计算框架,对用户观看视频及次数信息进行分析,建立用户性别和年龄区间的分类模型;然后利用特征项的权重优化模型,考虑到每个特征项在各个类别中的权重对分类结果的影响,提出了一种基于特征项与类别间相关性的TFC-IDFC权重计算方法,并与传统的TF-IDF权重计算方法进行比较,通过正确率和F1值两个指标,证明考虑到特征项与类别的相关性所提出的TFC-IDFC权重使得分类模型的分类能力更好。  相似文献   

2.
KNN算法在数据挖掘的分支-文本分类中有重要的应用。在分析了传统KNN方法不足的基础上,提出了一种基于关联分析的KNN改进算法。该方法首先针对不同类别的训练文本提取每个类别的频繁特征集及其关联的文本,然后基于对各个类别文本的关联分析结果,为未知类别文本确定适当的近邻数k,并在已知类别的训练文本中快速选取k个近邻,进而根据近邻的类别确定未知文本的类别。相比于基于传统KNN的文本分类方法,改进方法能够较好地确定k值,并能降低时间复杂度。实验结果表明,文中提出的基于改进KNN的文本分类方法提高了文本分类的效率和准确率。  相似文献   

3.
提出了一种基于正弦级数拟合的行为识别方法.该方法利用二值轮廓序列来表示给定的运动图像序列,按照时针顺序计算从轮廓质心到轮廓边界点的距离,将人体轮廓转化为距离曲线,并将这一距离曲线利用正弦级数进行拟合,将距离曲线转化为正弦参数,从而极大地减小了计算量,将行为识别过程转化为曲线参数特征匹配的过程.在特征匹配过程中,通过计算待预测行为与已知类别行为的特征级数距离,对待预测行为中的每一个动作进行分类,最后通过投票决定该行为所属类别.在包含90个不同运动类别的视频数据库上进行留一交叉验证,实验结果表明,提出的方法能够有效地进行人体行为识别.  相似文献   

4.
基于类别随机化的随机森林算法   总被引:1,自引:0,他引:1  
随机森林是数据挖掘和机器学习领域中一种常用的分类方法,已成为国内外学者共同关注的研究热点,并被广泛应用到各种实际问题中。传统的随机森林方法没有考虑类别个数对分类效果的影响,忽略了基分类器和类别之间的关联性,导致随机森林在处理多分类问题时的性能受到限制。为了更好地解决该问题,结合多分类问题的特点,提出一种基于类别随机化的随机森林算法(RCRF)。从类别的角度出发,在随机森林两种传统随机化的基础上增加类别随机化,为不同类别设计具有不同侧重点的基分类器。由于不同的分类器侧重区分的类别不同,所生成的决策树的结构也不同,这样既能够保证单个基分类器的性能,又可以进一步增大基分类器的多样性。为了验证所提算法的有效性,在UCI数据库中的21个数据集上将RCRF与其他算法进行了比较分析。实验从两个方面进行,一方面,通过准确率、F1-measure和Kappa系数3个指标来验证RCRF算法的性能;另一方面,利用κ-误差图从多样性角度对各种算法进行对比与分析。实验结果表明,所提算法能够有效提升集成模型的整体性能,在处理多分类问题时具有明显优势。  相似文献   

5.
近年来,基于教师-学生的知识蒸馏框架在图神经网络方面取得了较好的表现.然而这类知识蒸馏框架仍存在一些问题,如教师模型的知识信息不够全面,不能很好地指导学生模型;学生模型自身学习能力较差.为了解决这两方面的问题,本文提出了基于双通道知识蒸馏的节点分类方法.具体而言,该方法引入双教师模型,分别从拓扑结构和特征属性两个方面进行学习,保证了教师模型知识信息的多样性和全面性.学生模型采用参数化标签传播和邻居特征聚合两种预测机制,保证其具有更好的学习能力.最终,双教师模型分别从拓扑结构和特征属性两个方面对学生模型进行指导.在5个真实数据集上的实验结果表明该模型与最优基准模型相比具有更好的分类效果.  相似文献   

6.
分类问题是数据挖掘领域的研究热点之一。多标签分类器可以将数据对象预测为多个类别,训练集中属性相同但对应类标签不同的对象的数目是不平衡的,而现有的评估算法并未能区分其代价。提出了一种基于不同权重的准确性评估方法EMOWDIF,根据多标签数据对象属于相同属性不同类别的数目之间的比值计算相应的权重,对分类器模型给予不同程度的奖惩,从而区分不同分类器的性能。方法用编程实现,并对多标签数据集的分类结果进行评估。实验结果表明该方法能有效评估分类器。  相似文献   

7.
利用实体之间的相互关系来对实体进行分类的网络数据分类是数据挖掘的一个重要研究内容.现有的网络数据分类方法普遍根据邻居节点的类别来对节点进行分类.这些方法在同质性程度较高的网络中达到了很高的分类精度.然而在现实世界中,存在许多同质性程度很低的网络.在低同质性网络中,大多数相连节点的类别不同,所以现有方法难以正确预测出节点的类别.因此,提出了一种新的网络数据分类方法.其主要思路是建立一个描述网络的概率生成模型.在这个概率生成模型中,将网络中的边作为观察变量,将未知类别节点的类别作为潜在变量.通过吉布斯采样方法对模型进行求解,计算出潜在变量的取值,从而得到未知类别节点的类别.在真实数据集上的对比实验表明,提出的分类方法在低同质性网络上有更好的分类性能.  相似文献   

8.
张刚强  刘群  纪良浩 《计算机科学》2018,45(12):153-159
如何对评论数据进行正确的情感分类是情感分析中的重要研究内容。从粒计算和认知学角度,提出了一种基于序贯三支决策的多粒度中文评论情感分类方法。首先,基于评论数据集的特点,根据评论中情感信息量的多少,提出一种由粗到细的多粒度情感信息表示方法;然后,结合序贯三支决策的思想在不同粒度依据情感信息进行逐步计算,对边界域评论序贯地进行三支决策;最后,根据不同粒度的决策阈值和成本对评论做出最终的情感分类。对比实验结果表明,该方法在3个经典评论数据集上获得了更好的结果,具有更高的分类正确率和更强的鲁棒性。  相似文献   

9.
针对智能科学与技术专业数据挖掘课程中的知识难点,引入智能科学的重要问题——使机器理解人类情感,提出基于情感计算的数据挖掘课程教学案例。笔者利用伦敦玛丽女王大学研究者建立的情感识别数据集,由浅入深地设计了针对数据预处理、聚类分析、关联性分析、分类、回归分析知识点的5个课堂和上机实验教学案例;规划了一项基于脑电信号识别情绪状态的课程作业,培养学生的综合知识运用能力和团队协作能力。这些教学案例引导学生分析与人类情绪密切相关的认知数据,形象展示不同数据分析算法的功能特点,在提高教学效果的同时帮助学生了解智能人机交互技术的前沿动态。  相似文献   

10.
莫建文  贾鹏 《自动化学报》2022,48(8):2088-2096
为了提高半监督深层生成模型的分类性能, 提出一种基于梯形网络和改进三训练法的半监督分类模型. 该模型在梯形网络框架有噪编码器的最高层添加3个分类器, 结合改进的三训练法提高图像分类性能. 首先, 用基于类别抽样的方法将有标记数据分为3份, 模型以有标记数据的标签误差和未标记数据的重构误差相结合的方式调整参数, 训练得到3个Large-margin Softmax分类器; 接着, 用改进的三训练法对未标记数据添加伪标签, 并对新的标记数据分配不同权重, 扩充训练集; 最后, 利用扩充的训练集更新模型. 训练完成后, 对分类器进行加权投票, 得到分类结果. 模型得到的梯形网络的特征有更好的低维流形表示, 可以有效地避免因为样本数据分布不均而导致的分类误差, 增强泛化能力. 模型分别在MNIST数据库, SVHN数据库和CIFAR10数据库上进行实验, 并且与其他半监督深层生成模型进行了比较, 结果表明本文所提出的模型得到了更高的分类精度.  相似文献   

11.
基于密度的聚类算法(DBSCAN)是最有效的轨迹数据挖掘方法之一,但基于密度的聚类算法往往受到输入参数选择的限制。在轨迹数据挖掘中,聚类结果不仅受到类内距离和类间距离的影响,还受到聚类中坐标点个数的影响。因此,提出了一种新的基于内外占空比的集群有效性指标来平衡这三个因素,该指标可以自动选择密度聚类的输入参数,并在不同的数据集上形成有效的聚类,优化后的聚类方法可应用于出行者行为轨迹的深度分析和挖掘。实验结果证明,与传统的有效性指标相比,提出的基于占空比的评价指标能够优化输入参数,获得较好的出行者位置信息聚类结果。  相似文献   

12.
肖友定 《微型电脑应用》2022,(1):178-180,205
由于线上教学时,学生与教师无法面对面交流,给教师监察学生行为与课堂表现造成极大不便,为此研究线上体育课堂在线人数智能评估方法.使用量化分析法采集在线人数学习行为相关信息数据,获得学习行为信息数据集;构建线上课堂在线人数信息处理系统,并利用可视化与平行坐标方法将学习行为数据进行分段评估处理,实现各段学习行为的准确评估.实...  相似文献   

13.
在高校中,“无线校园”的建设也成为了各大高校在数字化校园建设中的一个重要环节。无线校园的建设本着以方便师生实时交流沟通,促进教学方式的改革,提升教学质量和效率为目的,确保正常的教学工作的顺利进行的同时也要确保运营商的业务能正常进行,而不是为学生提供一个随时随地都能访问互联网娱乐的网络环境,因此必须有严格的接入控制管理方案。该方案应该能区分老师和学生(基于角色),又能区分教学区和生活区(基于地点),最好还能分时段处理(基于时间)。  相似文献   

14.
早期预警是在线学习中的重要主题,通过早期预警识别有不及格风险的学生可帮助教师及时开展个性化教学干预。使用深度学习模型对学生微观行为模式进行分析以提高早期预警的效果,并提出结合LSTM-autoencoder特征处理和注意力权重计算的不及格风险学生早期预警模型(LSTM-autoencoder and attention based early warning model,LAA)。该方法通过LSTM-autoencoder对学生行为时间序列数据进行特征处理,采用注意力机制计算关键预测因子。实验结果表明,LAA比基线模型取得更高的召回率,对低交互型和非持续型学生具有更好的识别效果,且能将教学干预时间提前;此外,该方法可识别影响成绩的关键周次和行为,可用于辅助教师开展在线教学指导。  相似文献   

15.
相似用户挖掘是提高社交网络服务质量的重要途径,在面向大数据的社交网络时代,准确的相似用户挖掘对于用户和互联网企业等都有重要的意义,而根据用户自己的兴趣话题挖掘的相似用户更符合相似用户的要求。提出了一种基于用户兴趣话题进行相似用户挖掘的方法。该方法首先使用TextRank话题提取方法对用户进行兴趣话题提取,再对用户发表内容进行训练,计算出所有词之间的相似度。提出CP(Corresponding Position similarity)、CPW(Corresponding Position Weighted similarity)、AP(All Position similarity)、APW(All Position Weighted similarity)四种用户兴趣话题词相似度计算方法,通过用户和相似用户间关注、粉丝重合率验证相似用户挖掘效果,APW similarity的相似用户的关注/粉丝重合百分比为1.687%,优于提出的其他三种算法,分别提高了26.3%、2.8%、12.4%,并且比传统的文本相似度方法Jaccard相似度、编辑距离算法、余弦相似度分别提高了20.4%、21.2%、45.0%。因此APW方法可以更加有效地挖掘出用户的相似用户。  相似文献   

16.
吴菁 《福建电脑》2020,(5):41-43
提升教学质量是高职院校人才培养工作的永恒主题。在信息化时代的今天,信息技术的融合为课堂教学的诊断与评估提供了新的视角。本文在弗兰德斯互动分析理论(FIAS)基础上,基于应用软件,对高校师生课堂互动行为进行研究。自动生成合理的分析报告,可为教师提升教学能力提供反思和改进的依据,帮助教师在教学过程中发现问题并及时诊改。  相似文献   

17.
人工智能是研究运用计算机系统模拟和延伸人脑功能的学科,当前在基础教育教学领域应用越来越广泛.该文从教师、管理者和学生三个视角对人工智能在基础教育教学中的应用进行文献综述和实地调研,旨在分析人工智能中典型的技术,包括计算机视觉、自然语言处理、知识图谱、大数据挖掘等在教育教学各个环节中的使用情况,并根据调研中发现的问题总结...  相似文献   

18.
精准教育从诞生之初就受限于技术发展缓慢,随着信息技术的大力发展,教学管理系统,学生自主学习APP系统,基于微信学习平台的广泛应用,促使数学课程教育方面数据快速增长,使得学生的学习的行为,过程,状态,练习结果,成绩等成为可以被信息技术自动抓取的数据存在,这样使得获取精准教学的测量数据更为便捷和有效。首先分析了数学课程教学活动中存在的问题,然后对信息化教学模型构建进行了分析。以大数据中Apriori算法为主要思想,设计了基于学生数学学习效果提示和老师教学效果预测功能的数据挖掘系统,实现了对可能学习效果不理想的学生和可能教学方向不精准的老师的及早提示,同时可避免学生教师过度重复已掌握很好的知识,精准定位每位学生薄弱环节并加以改进,既可减轻师生负担,又可提高教学效果。  相似文献   

19.
任俊伟  曾诚  肖丝雨  乔金霞  何鹏 《计算机应用》2021,41(11):3164-3170
基于会话的推荐旨在根据当前用户的匿名会话的点击序列信息来预测用户的下一次点击行为。现有方法多数都是通过对用户会话点击序列的物品信息进行建模,并学习物品的向量表示,进而进行推荐。而作为一种粗粒度的信息,物品的类别信息对物品有聚合作用,可作为物品信息的重要补充。基于此,提出了基于会话的多粒度图神经网络推荐模型(SRMGNN)。首先,使用图神经网络(GNN)得到会话序列中的物品和物品类别的嵌入向量表示,并使用注意力网络捕捉用户的注意力信息;然后,将赋予了不同注意力权重值的物品和物品类别信息进行融合后,输入到门限循环单元(GRU)里;最后,通过GRU学习会话序列的物品时序信息,并给出推荐列表。在公开的Yoochoose数据集和Diginetica数据集上进行实验,实验结果验证了该模型在增加了物品类别信息后的优势,且实验结果表明了在Precision@20和MRR@20这2种评价指标上,该模型相较于短期注意力/记忆优先级(STAMP)模型、神经注意力(NARM)模型、GRU4REC等8种模型均有更好的效果。  相似文献   

20.
The English cloud classroom learning system provides a simple and effective way to access cloud-based training and learning materials. Student records based on behavioral modeling and interactive volume are assumed that the degree of student participation in the course measure. Previous studies, typically the frequency of student activities while ignoring temporary information. Analysis of Students' Activities in the course over time. According to the online classroom activity data, similar behavior change with time students are clustered. These results are three different groups. A large majority of inactive students. Another group to active throughout the students. However, a group of students to the event, but their activity will be reduced throughout the course. These student groups exhibit different performance. Overall students more active, the better the results. In addition to these general trends, also identified a trend of alternative courses that can be found, for example, becomes an active group of students in the course. It suggests that students' behavior is identified from a single course of conduct than the more complex, multi-mode learning activities course. More research is essential. In this study, investigated the Portuguese teachers 'views on classroom management, the relationship between self-off and the efficacy of teachers' and teachers' perception of classroom behavioral teachers' perception of time. Use mediator and moderator variables on the cloud classroom management, and teachers of English teachers perceive the relationship between classroom conditions were cheating process analysis.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号