共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
增量学习是一种在巩固原有学习成果的基础上快速有效地获取新知识的学习模式.本文在简述增量学习的相关研究以及排序学习前向掩蔽模型(SLAM)的特点后,提出了一种基于SLAM的快速增量学习算法.该算法在原神经网络模型分类能力的基础上,实现对新增样本的快速增量学习,从而在较短的时间内提高该网络模型的分类推广能力.最后,与SLAM算法和Levenberg-Marquardt 后向传播(LMBP)算法的实验对比结果证实了该算法的有效性. 相似文献
3.
一种基于主题相关度的网页排序算法 总被引:1,自引:0,他引:1
针对现有基于链接结构的PageRank算法的不足,提出了基于网页主题相关度的改进PageRank算法.通过分析网页内容,提取出网页中的链接及其对应的锚文本,建立网页链接库,利用向量空间模型(VSM)计算链接锚文本和网页内容的相关度,在此基础上实现离线计算改进后的PageRank算法.理论分析和仿真实验表明,改进的PageRank算法使用户能方便地找到所需网页,提高了网页查询效率. 相似文献
4.
Hash学习技术目前被广泛应用于大规模数据的相似性查找中,其通过将数据转化成二进制编码的形式,同时提高查找速度和降低存储代价。目前,大多数Hash排序算法通过比较数据在欧氏空间和海明空间的排序一致性来构造损失函数,然而,在海明空间的排序过程中,因为海明距离是离散的整数值,可能存在多个数据点共享相同的海明距离,这样就无法准确地排序。针对这一问题,将编码后的数据切分成几个长度相同的子空间,并为每个子空间设置不同的权重,比较时,再根据不同的子空间权重来计算海明距离。实验结果表明,与其他Hash学习算法相比,本文算法能够有效地对海明空间中的数据进行排序,并提高查询的准确性。 相似文献
5.
为解决实际应用场景中常面临的数据标注不足的问题,提出一种基于变分主题模型的半监督文本分类模型。首先使用无监督变分主题模型挖掘出语义信息集中的文档-主题分布,作为有效的文档特征表示,再通过半监督方式训练分类器。基于神经网络的变分主题模型相较传统的主题模型,不仅可以得到合理的主题,而且推断速度更快。在20NewsGroup等数据集上的实验结果表明,所提出的模型仅使用30%的训练数据就可以取得与使用90%训练数据的半监督基线模型相当甚至更好的结果,证明了所提出模型的正确性和实用性。 相似文献
6.
为了提高查询精度,提出了一种个性化元搜索引擎模型.在该模型中,引入了一种基于用户兴趣模型的加权位置/摘要的查询结果排序算法,该算法综合考虑了查询结果的摘要与查询的全局相关度、查询结果在各个成员搜索引擎返回结果中的排列位置信息、各个成员搜索引擎对查询意图主题类别的相关度三方面的信息.实验表明该排序算法能较好地把与用户查询意图相关的结果排在查询结果的最前面,提高了查准率. 相似文献
7.
有监督主题模型的SLDA-TC文本分类新方法 总被引:1,自引:0,他引:1
本文提出了一种有监督主题模型的SLDA-TC(Supervised LDA-Text Categorization)文本分类方法,引入主题-类别概率分布参数,识别主题-类别的语义信息;提出SLDA-TC-Gibbs主题采样新方法,对每个词的隐含主题采样,只从该词所在文档的同类其它文档中采样,并给出了理论推导;另外,其主题数只需略大于类别数.实验表明,对比LDA-TC(LDA-Text Categorization)和SVM算法,本方法能提高分类精度和时间性能. 相似文献
8.
问答社区作为搜索引擎的补充,在人们生活中起到越来越重要的作用,但随着大量问答对的积累,部分答案不能及时得到其他用户的评价,使得提问者选择最佳答案的难度加大。文中在研究用户行为及其行为所产生的结果后,提出一种新的基于主题模型的候选答案排序方法。通过大规模的实验数据证明,相较于其他模型方法,取得了较好的效果。 相似文献
9.
10.
针对基于有监督学习的依存句法分析模型的研究现状与进展进行了总结。重点综述了标注语料匮乏、特征选择与提取、模型一体化三个问题的相关研究内容。首先,详细介绍人们借助依存关系映射和主动学习摆脱标注语料匮乏困境的相关研究;其次,重点总结了不同特征对构建依存句法分析模型的贡献,例如句子级特征、词类别特征、语言形态特征和高阶特征等;最后,分析了依存句法分析模型一体化的优势与不足;此外,详细总结了如何借助该类模型解决事件抽取、产品评论分析和舆情分析等问题。 相似文献
11.
12.
Catastrophic events cause casualties, damage property, and lead to huge social impacts. To build common standards and facilitate international communications regarding disasters, the relevant authorities in social management rank them in subjectively imposed terms such as direct economic losses and loss of life. Terrorist attacks involving uncertain human factors, which are roughly graded based on the rule of property damage, are even more difficult to interpret and assess. In this paper, we collected 114 183 open-source records of terrorist attacks and used a machine learning method to grade them synthetically in an automatic and objective way. No subjective claims or personal preferences were involved in the grading, and each derived common factor contains the comprehensive and rich information of many variables. Our work presents a new automatic ranking approach and is suitable for a broad range of gradation problems. Furthermore, we can use this model to grade all such attacks globally and visualize them to provide new insights. 相似文献
13.
捕鱼算法优化核极限学习机的微博热点话题预测 总被引:1,自引:0,他引:1
微博热点话题预测对网络舆情控制与管理具有重要意义,针对微博网络热点话题的随机性、非线性以及核极限学习的隐层权值和隐层阈值优化难题,提出一种捕鱼算法优化在核极限学习的微博热点话题预测模型。首先将微博网络热点话题历史样本划分训练样本和测试样本集,然后采用在核极限学习对微博热点话题训练样本进行学习与建模,并采用捕鱼算法优化在线极限学习的隐层权值和隐层阈值,最后采用微博热点话题测试样本对其性能进行测试。实验结果表明,本文模型可以描述微博热点话题的发展趋势,提高了网络热点话题的预测精度,而且性能优于其它网络热点话题预测模型。 相似文献
14.
目前4G室内深度覆盖不足问题是影响客户体验和运营商收益的主要因素。本文通过对室分站点性能和用户MR等数据的全量采集与研究分析,利用AI技术建立室分故障特征模型,并根据模型中好点和差点与室分物业点、站点、小区进行匹配,实现室分故障的精准定位,进一步提升网络优化及维护工作效率。 相似文献
15.
16.
17.
为满足新时代通信需求,新一代通信网络应具有速率更快、容量更大和覆盖范围更广等特点。通过在通信网络中混合应用不同调制格式可以满足新一代通信网络的要求。面对未来通信网络中多种调制格式混用且多变的情况,正确识别信号调制格式可以为后续使用数字算法提升性能提供基础。机器学习因其在特征提取和分类能力上较传统方法具有明显优势,因此将机器学习技术应用于调制格式识别领域成为当下热点。文章介绍了几种应用于基于特征提取分类方案的机器学习方法,并对其应用做出了分析、比较与总结。 相似文献
18.
Accurately identifying network traffics at the early stage is very important for the application of traffic identification. Recent years, more and more research works have tried to build effective machine learning models to identify traffics with the few packets at the early stage. However, a basic and important problem is still unresolved, that is how many packets are most effective in early stage traffic identification. In this paper, we try to resolve this problem using experimental methods. We firstly extract the packet size of the first 2-10 packets of 3 traffic data sets. And then execute crossover identification experiments with different numbers of packets using 11 well-known machine learning classifiers. Finally, statistical tests are applied to find out which number is the best performed one. Our experimental results show that 5-7 are the best packet numbers for early stage traffic identification. 相似文献
19.
支持向量机应用于文本分类、手写数字识别、基因表达等许多领域,由于Harris角点检测算子对噪声点非常敏感,本文在文献[3]的基础上提出Harris算子和支持向量机相结合的方法来进行角点检测.首先利用Harris角点检测算法对两幅以上的无噪声图像提取角点,然后将提取的角点作为支持向量机的训练样本.构造支持向最机,最后利用... 相似文献