共查询到19条相似文献,搜索用时 78 毫秒
1.
《计算机应用与软件》2013,(4)
半结构化数据的形式化描述和信息抽取是解决用户查询和信息获取的核心问题。随着信息资源的多样化和快速膨胀,现有的描述和抽取方法存在召回率和查准率低等缺陷。为解决此问题,提出一种新的半结构数据形式化描述方法,重新定义领域概念集和领域知识集,并在此基础上给出领域概念集、领域知识集的构建过程,包括领域概念的自动抽取、领域知识集关系自动构建和相似度算法描述。实验结果表明,所提出的描述方法比现有方法具有更高召回率和查准率,具有很好的可行性和有效性。 相似文献
2.
面向CAD/CAM数据库中的信息通常中十分复杂的,因此,在单一的记录中存贮这种复杂的数据结构十分困难。根据工程应用的需要,应使得数据库管理系统能够支持抽象数据型以及具有数据语义结束条件的描述能力。本文介绍了在我们研制,开发的一个多用户工程数据库管理系统-NMEDAMS(Multiuser Engineering Database management System)中的结构以及数据语义信息的描述及操作。 相似文献
4.
针对目前概率机器学习方法在解决概率问题时具有较高的复杂度,而传统的支持向量数据描述(SVDD)作为一种核密度估计方法只能判断测试样本是否属于该类等问题,提出一种基于概率的支持向量数据描述方法。首先,利用传统的SVDD方法分别得到两类数据的数据描述,计算测试样本到超球体的距离;然后,构造一个将距离转换为概率的函数,提出一种基于概率的SVDD方法;同时,使用Bagging算法进行集成,进一步提高数据描述的性能。借鉴分类场景,将所提方法与传统的SVDD方法在Gunnar Raetsch的13种基准数据集上进行实验,实验结果表明,所提方法在准确率和F1值上优于传统的SVDD方法,并且其数据描述的性能有所提升。 相似文献
5.
6.
7.
赵颖颖 《数字社区&智能家居》2006,(2):38-39
大型的地质行业软件系统使用到多这几十种数据类型。在进行数据输入输出的时候,绝大多数数据的处理流程基本是一致的,但如果不能实现数据的统一描述,就无法实现该处理功能模块的复用,使得实现和维护成本很高。通过对十几种常用石油地质数据的组成和内部结构进行的研究,本文分析并提出了一套数据描述机制,论述了其实现的一些关键原理,并在地质行业软件数据输入输出系统得到验证。 相似文献
8.
为改善传统的基因表达数据聚类方法正确率偏低的问题,研究了支持向量数据描述(SVDD)算法在基因表达数据聚类中的应用,该方法通过寻找最优分类超球实现对数据集的有效聚类.将类间信息融入聚类有效性评估准则中,通过模拟退火优化算法寻找SVDD算法中的最优核函数参数和惩罚因子,在训练时引入非样本数据提高运算效率.对酵母细胞生长周期的基因表达数据集的仿真实验结果表明,在新的聚类有效性评估准则下进行参数寻优,能够更快更好地得到最佳参数,同时,算法具有聚类精度高和运算速度快的优点. 相似文献
9.
为解决异构的业务数据互联互通问题,通过分析业务领域的数据集成要求,研究了基于实体资源的数据集成方法.定义了实体资源的概念,从业务处理角度和数据动态特性上区分了实体资源的不同类别,提出了实体资源定义协议、访问协议、传输协议,并采用XML和二进制格式进行了协议设计,研究了实体资源的存储方法.通过设计和实现数据集成系统,验证了基于实体资源的数据集成是一种有效的集成异构系统数据的方法. 相似文献
10.
提出了一种数据空间中的命名实体集成模型(NEIM)及其在异质异构数据源中的集成方法。命名实体模型描述了数据源、实体与实体描述间的关系,能够实现从其中任意一个息查询到其它相关信息。命名实体的集成架构指出了数据空间中命名实体集成要完成的主要任务,包括命名实体的识别、实体的集成映射和实体的统一。集成算法描述了数据空间中异构数据源包含的命名实体及其描述信息的集成方法。针对结构化半结构化数据,它采取构建映射规则,使系统可以在后期持续集成这些数据源中的实体信息,实验验证了集成方法的构建映射规则的有效性。 相似文献
11.
知识图谱表示学习旨在通过学习的方法将知识图谱中的实体和关系映射到一个连续的低维向量空间而获得其向量表示.已有的知识图谱表示学习方法大多仅从三元组角度考虑实体间的单步关系,未能有效利用多步关系路径及其实体描述等重要信息,从而影响性能.针对上述问题,提出了一种融合关系路径与实体描述的知识图谱表示学习模型.首先,对知识图谱中的多步关系路径进行联合表示,将路径上的所有关系和实体相加,得到关系路径信息的表示;其次,使用BERT(bidirectional encoder representations from transformers)模型对实体描述信息进行编码,得到相对应的语义表示;最后,对知识图谱中的三元组表示、实体描述的语义表示以及关系路径的表示进行融合训练,得到融合向量表示.在FB15K,WN18,FB15K-237,WN18RR数据集上,对提出的模型和基准模型进行链接预测和三元组分类任务,实验结果表明,与现有的基准模型相比,该模型在2项任务中均具有更高的准确性,证明了方法的有效性和优越性. 相似文献
12.
13.
自动化实体描述生成有助于进一步提升知识图谱的应用价值,而流畅度高是实体描述文本的重要质量指标之一。该文提出使用知识库上多跳的事实来进行实体描述生成,从而贴近人工编撰的实体描述的行文风格,提升实体描述的流畅度。该文使用编码器—解码器框架,提出了一个端到端的神经网络模型,可以编码多跳的事实,并在解码器中使用关注机制对多跳事实进行表示。该文的实验结果表明,与基线模型相比,引入多跳事实后模型的BLEU-2和ROUGE-L等自动化指标分别提升约8.9个百分点和7.3个百分点。 相似文献
14.
作战仿真实体三维模型数据存储方法 总被引:2,自引:0,他引:2
为提高作战仿真实体三维模型存储和使用效率,对作战仿真实体模型进行了分类,制定了模型的层次细节、损伤分级、纹理和分组规则。构造了三维模型数据存储系统结构体系,提出了三维模型的层次体系结构,并对每层次数据结构进行了设计。最后介绍了三维模型重构算法。 相似文献
15.
数据量大、数据更新速度快、数据源多样和数据存在噪声是大数据的四大特点,这为数据集成提出了新的挑战.实体解析是数据集成的一个重要步骤,在大数据环境下,传统的实体解析算法在效率、质量,特别是抗噪声能力方面的表现并不理想.为了解决大数据环境中因为数据噪声所导致的解析结果冲突,将公共邻居引入相关性聚类问题.上层预分块算法基于邻居关系设计,因而能够快速有效地完成初步分块;核概念的引入更精确地定义了节点与类之间的关联程度,以便下层调整算法准确地判断节点的归属,进而提高相关性聚类的准确度.两层算法采用较为粗糙的相似度距离函数,使得算法不仅简单而且高效.同时,由于引入邻居关系,算法的抗噪声能力明显提高.大量实验表明,两层相关性聚类算法无论在解析质量、抗噪声能力还是在扩展性方面均优于传统算法. 相似文献
16.
数据空间中数据模型及实体关联关系挖掘的研究 总被引:2,自引:0,他引:2
数据模型的研究是目前数据空间中研究的主要问题之一,是数据空间管理系统提供其它服务的基础.由于数据空间中多种异构性数据资源的共存和松散连接的特点,有必要提出一个有效、简单而且通用的数据模型来描述和管理这些数据.本文提出了分层的图数据模型lgDM来描述数据空间中的各种数据并捕捉实体间和实体类间的语义关联信息;并给出了实体关联关系挖掘的不同策略和对图加权重的方法.lgDM具有较好地通用性和扩展性,实验结果表明所提出模型的可行性和有效性. 相似文献
17.
通过分析描述逻辑与面向对象数据模型之间的关系,研究了基于描述逻辑的模糊面向对象数据(fuzzy object-oriented data,简称FOOD)模型的表示与推理.首先,进一步研究了FOOD模型,提出了FOOD模型的形式化定义和语义定义,以便更好地在FOOD模型与模糊描述逻辑之间建立对应关系;然后,针对FOOD模型的特点和推理需求,介绍了模糊描述逻辑f-ALCIQ.在此基础上,研究了基于f-ALCIQ的FOOD模型的表示与推理,包括:实现了从FOOD模型到f-ALCIQ知识库在结构层和实例层上的转化,即实现了从FOOD模型到f-ALCIQ TBox的转化,以及从FOOD模型相应的数据库实例到f-ALCIQ ABox的转化;进而,基于转化得到的f-ALCIQ知识库,研究了如何利用f-ALCIQ的推理机制对FOOD模型的推理问题(一致性、包含性和冗余性等)进行推理;最后,设计并实现了基于f-ALCIQ的模糊描述逻辑推理机(FRsQ推理机),实现了对FOOD模型和f-ALCIQ模糊概念知识的自动推理. 相似文献
18.
19.
OR映射旨在为业务过程提供直观、简洁的面向对象的数据及访问方式犤2犦,业务实体、数据访问逻辑正是为了这样的目的而提出的。文章通过对OR功能和要素的仔细分析,提出了一套针对业务实体和数据访问逻辑的设计思想。 相似文献