排序方式: 共有24条查询结果,搜索用时 15 毫秒
1.
真值发现是数据集成领域具有挑战性的研究热点之一。传统的方法利用数据源与观测值之间的交互关系推断真值,缺乏足够的特征信息;基于深度学习的方法可以有效地进行特征抽取,但其性能依赖于大量手工标注,而在实际应用中很难获取到大量高质量的真值标签。为克服以上问题,本文提出一种基于多特征融合的无监督真值发现方法(Unsupervised truth discovery method based on multi-feature fusion, MFOTD)。首先,利用集成学习无监督标注“真值”标签;然后,分别使用预训练模型 Bert和独热编码获取观测值的语义特征和交互特征;最后,融合观测值多种特征并使用其“真值”标签构建初始训练集,通过自训练方式训练真值预测模型。在两个真实数据集上的实验结果表明,与已有方法相比,本文所提出的方法具有更高的真值发现准确性。 相似文献
2.
基于集成学习和二维关联边条件随机场的Web数据语义标注方法 总被引:2,自引:0,他引:2
大规模Web信息抽取需要准确、自动地从众多相关网站上抽取Web数据对象.现有的Web信息抽取方法主要针对单个网站进行处理,无法适应大规模Web信息抽取的需要.调查研究表明,有效地实现Web数据语义自动标注,结合现有的包装器生成技术,可以满足大规模Web信息抽取的要求.文中提出一种基于集成学习和二维关联边条件随机场的Web数据语义自动标注方法,首先,利用已抽取的信息和目标网站训练页面中呈现的特征构造多个分类器,使用Dempster合成法则合并分类器结果,区分训练页面中的属性标签和数据元素;然后,利用二维关联边条件随机场模型对Web数据元素间的长距离依赖联系和短距离依赖联系进行建模,实现数据元素的自动语义标注.通过在多个领域真实数据集上的实验结果表明,所提出的方法可以高效地解决Web数据语义自动标注问题,满足大规模Web信息抽取的需要. 相似文献
3.
4.
本文研究了形如Cθ(u,v)=uv+θuavb(1-um)c(1-vn)d的一类新型广义FGM Copula的相关性.求解了其和谐性度量Kendall相关系数τ和Spearman相关系数ρ,论证了和谐性度量相比于线性相关系数的优越性.以泥石流地貌要素之沟床比降和流域高差为例,计算了这两个地貌要素的线性相关系数r、和谐型... 相似文献
6.
结构化支持向量机(Structural Support Vector Machine,SSVM)是支持向量机(Support Vector Machine,SVM)的变体算法,被广泛应用于多个领域。阐述了SSVM的发展过程,详细分析了SSVM各种具体实现算法的思想及表现上的优劣;并通过实验的对比讨论,发现了SSVM的各种具体实现算法在分类性能和分类效率上优于其他SVM算法,而在稳定性上则逊于后者;基于此,给出了SSVM的后续研究方向。 相似文献
7.
提出一种融合化学反应优化与K均值的文本聚类算法.结合K均值聚类的局部快速开发寻优能力和化学反应优化的全局勘探能力,以K均值聚类解集合作为化学反应优化的初始分子结构群,通过引入单分子碰撞、单分子分解、分子间碰撞和分子间合成4种化学反应操作,增加种群分子多样性;利用融合余弦相似度和欧氏距离的适应度函数评估分子优劣,在扩展搜... 相似文献
8.
大系统最优控制的递阶算法 总被引:1,自引:0,他引:1
董永权 《河北工程大学学报(自然科学版)》2001,18(1):38-40
本文将动态规划的最优性原则与大系统控制论中的分解协调的递阶算法结合起来,考虑到各子系统间的顺序直接作用,提出了一种以两次型为性能指标的离散线性系统优化的算法,导出了各子系统的递推公式,并举有一个五阶系统的仿真示例。 相似文献
9.
10.
随着大规模在线开放课程(MOOC)平台的广泛使用,需要一种有效的方法为用户推荐个性化课程。针对现有的课程推荐方法通常利用课程学习记录为用户的学习兴趣建立整体的静态表示,但忽略了学习兴趣动态变化与用户短期学习兴趣的问题,提出一种分层分期的注意力网络(HPAN)进行个性化课程推荐。该网络的第1层利用注意力网络得到用户的长短期学习兴趣,第2层将用户的长短期学习兴趣和短期交互序列相结合并通过注意力网络得到用户的兴趣向量;然后计算用户兴趣向量与每个课程向量的偏好值,据此为用户进行课程推荐。在XuetangX(学堂在线)公开数据集上的实验结果表明,与次优的序列分层注意力网络(SHAN)模型相比,HPAN模型的Recall@5提高了12.7%,与FPMC(Factorizing Personalized Markov Chains)模型相比,它的MRR@20提高了15.6%。HPAN模型的推荐效果优于对比模型,可解决实际的个性化课程推荐。 相似文献