首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 359 毫秒
1.
智能答疑系统中基于聚类的问题分类研究   总被引:3,自引:0,他引:3  
研究了智能答疑系统中的问题分类。针对基于章节目录的分类方式过于依赖特定教材的不足,提出了基于关键词聚类的问题模糊分类方法。此方法基于关键词的语义,采用NERF算法对关键词进行聚类。并利用聚类有效性的方法来弥补此算法过于依赖初始值的不足。最后通过实例进行分析,说明此分类方法的可行性和对基于章节目录的分类方式不足的弥补。  相似文献   

2.
在此提出一种基于模糊聚类的目录查询新方法,该方法基于模糊C均值聚类算法,并结合了编辑距离算法。针对传统的模糊C均值聚类算法的聚类结果不稳定性问题,引入了高权样本点集;并且在处理聚类过程中的边界值归属不足问题,引入编辑距离算法。  相似文献   

3.
针对大多数现有的深度文本聚类方法在特征映射过程中过于依赖原始数据质量以及关键语义信息丢失的问题,提出了一种基于关键语义信息补足的深度文本聚类算法(DCKSC)。该算法首先通过提取关键词数据对原始文本数据进行数据增强;其次,设计了一个关键语义信息补足模块对传统的自动编码器进行改进,补足映射过程中丢失的关键语义信息;最后,通过综合聚类损失与关键词语义自动编码器的重构损失学习适合于聚类的表示特征。实验证明,提出算法在五个现实数据集上的聚类效果均优于当前先进的聚类方法。聚类结果证明了关键语义信息补足方法和文本数据增强方法对深度文本聚类的重要性。  相似文献   

4.
为了克服经典K~Means算法随机选择初始数据中心而易陷入局部最优解和聚类结果的不确定性问题,提出一种基于粒子群和KMeans算法的改进聚类算法以实现移动用户分类。首先,定义数据对象密度并采用改进的普里姆算法初始化聚类中心,然后,将此聚类中心用于初始化粒子位置,采用混沌粒子群算法寻优获得最优解作为最终的聚类中心,最后,采用经典K—Means算法根据最终聚类中心进行聚类。仿真实验表明文中方法能正确地实现移动用户分类,并具有较强的全局寻优能力和较快的收敛速度,弥补了经典K—Means方法的不足,具有较强的现实意义。  相似文献   

5.
针对二叉树支持向量机在多类分类问题上存在的不足,利用粒子群算法对模糊C均值聚类算法进行了改进,在此基础上,结合二又树支持向量机,构建了偏二叉树多类分类算法.该方法在二叉树各节点处根据聚类中心所对应的样本构造学习样本集和最优分类超平面,保障了聚类精度,有效地提高了测试正确率.实验表明,本文提出BT-SVM多类分类算法的测试正确率要高于同类多类分类算法.  相似文献   

6.
基于模糊聚类和Naive Bayes方法的文本分类器   总被引:3,自引:0,他引:3       下载免费PDF全文
本文提出一种文本分类的新方法,该方法将模糊聚类与基于Naive Bayes的EM分类算法相结合,从而大大提高了EM分类算法的准确性,并解决了使用字符匹配引起的不完整性和不准确性问题。该方法首先给出每个类的一些关键词,并把这些关键词作为聚类中心进行聚类,然后使用距离聚类中心较近的文档启动一个引导过程。  相似文献   

7.
针对卷积神经网络应用于图像分类任务时需要大量有标签数据的问题,提出一种融合卷积神经网络和聚类分析的无监督分类模型,将无监督算法引入深度学习,并将该模型应用到图像分类领域,来弥补现有分类方式的不足.首先对经典卷积神经网络AlexNet从网络结构和模型训练两个方面进行优化;然后利用改进后的自适应快速峰值聚类算法指导聚类过程...  相似文献   

8.
通过分析数据库的数据模型.研究基于内容的多媒体数据库管理系统的构建方法及其功能框架,采用PL/SOL方式访问Oracle 8i数据库.为了提高管理系统的图像检索速度,提出了一种基于内容的图像检索算法,从聚类中心初值选取和分类中心的更新方面改进C-均值聚类算法,较好地解决了图像的分类问题.实验表明:使用该聚类检索算法,能对分类中心进行快速更新,有效地对图像进行聚类以及缩短检索时间,检索性能优于现有的C-均值聚类算法.  相似文献   

9.
为有效地弥补全文搜索引擎的不足,提出了一种动态求解的最优密度聚类算法并加以实现.该算法构造了一颗簇关系树,将两种典型聚类算法:密度聚类算法DBSCAN和层次聚类算法BIRCH进行有效结合,对聚类参数ε进行动态求解,以达到参数ε的最优.与其它文本聚类算法相比,该算法的查询结果与用户感兴趣的主题相关度较大,对具有二义性的关键词有较高的查准率,能有效提升搜索引擎的查询效率,加快用户搜索信息的速度.  相似文献   

10.
基于Mean-Shift的广播音频聚类算法   总被引:1,自引:0,他引:1  
针对大多数聚类算法依赖聚类数目这一先验知识的不足,提出一种基于均值漂移(Mean-Shift)的新广播音频聚类算法.对需聚类的音频段选取基于小波域的特征构造特征集合,通过主成分分析方法降低所提取特征中的冗余信息.在此基础上,采用Mean-Shift算法对音频信号进行初步聚类,然后利用快速近邻法对其聚类结果进行一次修正,最后合并仅含有单个样本类别的类进行二次修正.实验结果表明,该算法的聚类精度有一定的提高.  相似文献   

11.
中文问答系统中的问句理解   总被引:4,自引:0,他引:4  
卢志坚  张冬茉 《计算机工程》2004,30(18):64-65,153
描述了一种通过人工总结规则建立模型来理解问答系统中问句的方法。该模型采用浅层语法分析和部分语义分析相结合的方法来断定一个问句所包含的信息。  相似文献   

12.
《软件工程师》2015,(11):30-31
近年来,问答系统被大量广泛的研究,问答系统的目标是给定一个问题,能够得到简短精确的答案;而问句分类在问答系统中有着重要的作用,为此本文用朴素贝叶斯算法对问句分类做了一定的研究。从实验结果来看,该方法在实际应用中取得了较好的效果。  相似文献   

13.
在社区问答系统中,每天大量涌现的问题导致用户很难寻找自己感兴趣并且擅长的问题进行回答。为了更好地解决这一问题,本文根据用户兴趣,将用户的活跃度指数融入推荐算法。实验结果显示,该方法在一定程度上提高了问题推荐的效率。   相似文献   

14.
Question Answer     
壹问题我的电脑里面有许多我不需要的字体,由于这些字体延长了电脑的启动时间,如何把它们安全地移去?回答最好的方案是转移它们,而不是删除,这样当您需要的时候,还能再方便地使用这些字体。首先,在您的硬盘上创建上个名为"多余字体"的文件夹,然后用IE打开这个文件夹,选择"开始"运行",输入"fonts",按回车键,让这个文件夹进入另一个IE窗口,之后双击不需要的字体,选择"转移"该字体,把它们拖到  相似文献   

15.
问题理解是问答系统中的重要组成部分,尤其对于协作式问答。在协作式问答中用户对所提出的问题进行了详细的说明和描述。如何利用这些描述信息来提高系统的性能,是一个很重要的问题。该文提出了一种基于词典和句法分析的方法,来对用户的问题进行分析,从中提取出有价值的关键词,以提高包含候选答案网页的召回率。通过实验对比分析,该方法的MPP值和MAP值都有了较大的提高。  相似文献   

16.
问题生成旨在理解输入端的语义,从而自动生成疑问句。该文主要解决目标答案可知的问题生成任务,输入为陈述句和目标答案,输出为疑问句,该疑问句的答案为给定的目标答案。为了提高问题类型的准确率,使问句的表述更确切,该文提出一种融合问题类型及惩罚机制的问题生成模型,首先使用预训练BERT模型对问题类型进行分类,得到对应问题类型的表示。在编码端,通过门控机制将源端陈述句与问题类型进行融合,得到具有问题类型信息的源端表示。此外,在现有工作中观测到生成的问句和目标答案存在重复词的现象。为了缓解上述问题,该文提出一种惩罚机制,即在损失函数中加入对重复词的惩罚。实验证明,该文所提方法有效提高了问题类型的准确率,并在一定程度上降低了生成重复词的情况。在SQuAD数据集上BLEU-4值达到18.52%,问题类型的准确率达到93.46%。  相似文献   

17.
问答系统可以针对用户提出的自然语言问题给出精准的答案,是自然语言处理领域中一个重要的研究方向。对于具有复杂语义结构和句法结构的多跳问题,模型需要强大的自然语言理解能力。问题分解作为问题理解的一种技术,有着不可估量的作用。阐述了问题分解的研究背景与意义;根据问题特征提取的方式,将现有的方法分为传统机器学习方法和深度学习方法两大类,传统机器学习方法以规则模板匹配和基于分割的方法为主,深度学习方法以基于Transformer、图神经网络、注意力机制、查询图和强化学习为主,并分别从模型架构、优势、劣势等方面进行分析。结合目前研究的动态,初步展望了未来的研究方向。  相似文献   

18.
对中文问答系统中的问题理解技术进行了研究。问题理解是问答系统的基础,问题理解的核心内容是问题分类。本文对基于规则和统计方法的问题分类体系做了介绍,提出了基于事件框架的问题语义描述模型,给出了疑问意向的形式化定义。同时借助知网,对问题空间的大小进行评测。  相似文献   

19.
该文描述了一种基于事例,通过人工总结规则建立模型来分析问答系统中问句,应用自然语言处理的相关技术,分词和专有名词识别对问句进行预处理,然后依据从3800多个问句中总结归纳出来的问句信息成分,进行问句的浅层分析。以及短语结构分析,获取问句的各个信息成分以及他们之间的依存关系。这些模型采用浅层语法分析和部分语义分析相结合来断定一个问句所包含的信息。同时在英文问答系统的基础上,提出了问句类型学和限制成分的语义类型学,深化了问句的表达形式,以能更好的解析问句。  相似文献   

20.
基于依存关系的问句理解与问句分类   总被引:1,自引:0,他引:1  
问句理解是问答系统的首要过程,问句分类是问句理解的主要组成部分,它在问答系统中具有非常重要的作用,因为问句类型有助于在文档中定位和抽取答案。问句分类的目标是基于预期的答案类型,准确地分类问句。本文提出依存关系规则与统计方法相结合,实现了基于依存关系的中文问句理解与问句分类机制。实验表明:支持向量机结合依存关系的特征抽取方法,获得了较高问句分类正确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号