首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 25 毫秒
1.
结构化文档是云计算环境中实现信息交互与传播的载体,针对已有研究工作缺乏能够描述这种载体的结构化文档模型的问题,在深入分析云计算环境中结构化文档特征的基础上,对文档元素、原子文档元素、连接、文档片段、复杂文档元素等进行形式化定义,建立能够满足这种特征的结构化文档形式化模型。最后,指出云计算环境中结构化文档进一步的研究方向。  相似文献   

2.
信息技术的快速发展促使非结构化数据管理成为一个重要的问题.非结构化数据的主要特点是数量巨大和模式滞后.传统的关系数据管理系统在处理非结构化数据上难以提出有效的解决方案.从"现实的数据总是包含着诸多特征(feature)观点出发,提出了"数据-特征模型",建立特征,特征空间以及数据类型等概念.在此基础上提出了基于特征的非结构化数据演化管理建模框架.同时简述了非结构化数据管理原型系统MYUSD的结构.  相似文献   

3.
吴鸿华  刘思峰  方志耕 《控制与决策》2022,37(11):3033-3041
针对现有面板数据关联分析模型中指标的排列顺序变换引起灰色关联序不一致以及面板数据三角曲面构造的不足,提出一种基于面板数据的灰色四面体网格关联分析模型.首先,基于数列的组合原理将样本矩阵分解为二元指标子矩阵;其次,将二元指标子矩阵投射为空间四面体网格,并给出四面体的有向体积;然后,基于有向体积构造二元指标的关联系数,最终得到灰色四面体网格关联分析模型,并对模型的对称性、规范性、平移不变性等性质进行证明;最后,将模型应用到山东省沿海城市的空气质量评价,验证模型的合理性和有效性,并分析了灰色四面体网格关联分析模型不受指标排列顺序变化的影响.  相似文献   

4.
为了直观、精确地控制模型的形变,提出一种基于自定义四面体坐标系的三维变形计算方法.首先从几何上给出四面体坐标系的定义,阐述并证明了其关于几何变换的一些性质,使得拓扑变形易于实现,并可应用在三维变形技术中;然后描述了基于四面体坐标系的2种三维变形算法:嵌入式变形与基于特征的精确变形算法.通过多个变形实例结果证明,该方法能够有效地实现物体的变形以及物体间的渐变.  相似文献   

5.
非结构化数据的可视化编辑系统   总被引:1,自引:0,他引:1  
在创新计算中碰到大量的非结构化数据,采用超图模型实现非结构化数据在计算机中的存储与表示,并实现了一个非结构化数据的编辑系统,通过图形界面,用户可以交互式的编辑非结构化数据。  相似文献   

6.
网络安全领域中威胁情报的描述方式多种多样,迫切需要一种对威胁情报格式化描述的标准,将非格式化情报信息,转化为格式化数据,为情报的可视化知识图谱提供支撑。针对STIX 2.0的描述规范,提取了适应于网络安全威胁情报中的本体元素,构建了一个可共享、重用、扩展的威胁情报本体模型,并对领域本体、应用本体和原子本体进行了详细分类。将该模型应用在Poisonivy攻击事件中,提取了Poisonivy研究报告中的61个实体,102个关系,并将抽取的格式化数据导入Gephi进行可视化表达。通过对威胁情报本体模型的构建,完成了情报信息从非结构化到结构化的转换,并使用统一的语法进行描述,最终以知识图谱的方式来表达情报中重要元素,可以快速定位网络安全事件中的核心元素及之间关系,为网络安全分析者和决策者,提供重要依据。  相似文献   

7.
为满足用户的复杂检索需求,对用户行为特性进行分析,提出一种非结构化数据的星系数据模型.基于对文件系统中属性使用情况的统计结果,通过优化文件属性、增加用户行为特性属性等方法,形成非结构化数据属性集.在此基础上,使用一个数据对象和基本类、内容类、特征类、行为类、环境类等5个属性类表示一个非结构化数据,构建非结构化数据模型.对模型进行了仿真分析,分析结果表明了模型有效且可行,具有轻量级、支持复杂检索、检索结果准确度高等优势,为大数据管理提供支撑.  相似文献   

8.
Verilog操作语义研究   总被引:3,自引:1,他引:2  
李勇坚  何积丰  孙永强 《软件学报》2002,13(10):2021-2030
提出了一个结构化操作语义模型,用于描述Verilog核心子集的语言特征,此子集包含了事件驱动、基于共享变量的并发特性、时间延迟等Verilog的主要语言成分.在此操作语义模型中,所有的Verilog程序将被统一地认为是开放式系统,所以在此操作语义模型的基础上能够进一步提出Verilog开放进程的观察模型,并提出基于互模拟的观察等价概念来判定进程之间的等价关系.最后证明了所定义的观察等价关系对所有的Verilog构造子而言是一个同余关系,从而为发展相应的进程代数理论提供了一个可靠性基础.  相似文献   

9.
为实现不同模型之间特征对应的光滑渐变,提出一种直接建立模型间对应关系的方法.根据输入模型的结构特点,首先将模型划成对应的若干部分,并对各部分依据特征进行相同的类球状四面体网格划分;然后针对每组四面体内的数据,通过计算确定源模型上的每个点在目标模型中的对应点;最终从整体上实现源模型到目标模型的直接对应.由于各部分类球状四面体网格的连接形似藕节,且对应关系的建立主要基于四面体坐标系,因而称总网格为藕节状四面体坐标系网格.多个实例结果证明,该方法能够有效地实现模型间特征对应的渐变.  相似文献   

10.
仿真想定描述规范对加快想定数据准备速度,提高想定数据质量,并促进想定数据重用具有重要意义.深入辨析了军事想定、仿真想定、仿真想定片段、仿真想定变体等相关概念,梳理了基于定制数据格式的仿真初始化、仿真想定描述语言及应用、仿真想定描述规范等方面国内外研究现状,归纳了现有研究在描述规范的结构化、基本元素模型、仿真想定元数据方面存在的不足,指出了仿真想定数据体系构成、仿真想定数据描述规范以及仿真想定数据管理机制等下一步重点研究方向.  相似文献   

11.
作为CSCW的一个分支,群体决策支持系统(GDSS)是各决策领域结合数据、分析工具和模型以支持半结构化、非结构化决策的计算机系统。文章描述了它的发展概况和模块划分,提出了其中一个关键步骤-集体自由讨论(Brainstorm)的一个模型,并从表示级、系统协同级、存储级等各个级别具体讨论了Tcl/Tk及GroupKit的实现技术细节。  相似文献   

12.
刘昆  孟晓静 《计算机仿真》2021,38(9):297-300,475
随着系统复杂程度的增加,信息采集时很容易受到其它因素的影响而形成交叉覆盖,使信息具有不平衡、非线性等特点,难以实现信息的准确可靠捕获.为此提出一种基于机器学习的交叉覆盖信息捕获算法.为防止训练过程中单纯的距离计算引发邻近关系误判,采取欧式距离和局部均值相结合搜索特征属性的邻近元素,通过与特征属性的内外映射筛除原始信息中的非关联属性.为降低信息冗余度,利用信息熵描述未知信息量,并在信息熵基础上引入互信息来描述数据间的依赖关系,根据互信息矩阵完成主成分特征提取.最后利用机器学习的良好逼近性,构建SLFN学习网络,对网络模型进行正则化处理,并通过构建Lagrange函数求解网络输出加权,从而实现数据分类.仿真结果表明,所提算法对于不同复杂度的数据集具有更好的适应性,能够显著提高交叉覆盖信息捕获的准确率、鲁棒性,以及抗噪性.  相似文献   

13.
分类体系完善、药品信息全面的药品知识库能够为临床决策以及临床合理用药提供依据和支持。该文以国内的多个医药资源作为参考和数据来源,建立了药品库知识描述体系和分类体系,对药品进行标准化分类并形成详细的知识描述,构建了多来源的中文药品知识库(Chinese Medicine Knowledge Base,CMKB)。所构建的CMKB的分类包括27种一级类别和119种二级类别,从药品的适应证、用法用量等多个层面对14 141种药品进行描述并采用BiLSTM-CRF和T-BiLSTM-CRF模型将非结构化描述中的疾病实体进行了信息抽取,形成了对药品属性的结构化信息抽取,建立了药品实体与自动抽取的疾病实体之间的知识关联。所构建的CMKB能够与中文医学知识图谱进行连接,扩充药品信息,并能够为智能诊断和医疗问答等提供知识基础。  相似文献   

14.
角色约束模型及其在软件模式实现中的应用   总被引:2,自引:0,他引:2  
何成万  何克清 《计算机工程》2005,31(12):15-17,89
在已有的角色约束描述方法的基础上,对角色约束进行了分类,提出了一个结构化的角色约束模型SRCM及形式化方法,分析了模型中角色约束间的关联,并介绍了角色约束在建模中的应用实例。使用该结构化的角色约束模型不仅可以更完整地描述角色约束,而且可以使角色约束的描述更加清晰,有助于设计者实现角色的分配及组合,有利于角色模型的实现。  相似文献   

15.
信息抽取技术用于从非结构化文本数据中提取关注度较高的信息。事件抽取技术是信息抽取研究领域中具有挑战的研究方向。事件抽取的目的是从非结构化文本数据中抽取描述事件的关键元素,并以结构化的方式呈现。事件抽取被看作序列标注任务,首先采用ALBERT预训练模型学习特征,其次引入条件随机场CRF模型提高序列标注性能,最后完成事件类型以及事件要素的识别分类。在ACE2005标准语料库上的实验结果表明,与现有模型相比,ALBERT-CRF模型在触发词识别和分类任务上的召回率和F值均有所提高。  相似文献   

16.
随着医疗信息化水平的不断提高, 电子病历得到了越来越广泛的应用, 其中的非结构化文本包含大量蕴含患者病况信息的可度量数量信息, 由于实体与数量信息表述的复杂性, 从非结构化电子病历文档中精准抽取可度量数量信息是一个重要的挑战. 本文基于双向门控循环单元提出了结合相对位置特征与注意力机制的RPA-GRU模型, 通过将相对位置特征融入注意力机制更新双向门控循环单元输出, 识别实体与数量信息. 并基于重构句法依存树的图注意力网络学习图级表示提出GATM模型, 实现实体与数量信息的关联. 实验基于1 359份三甲医院烧伤科电子病历数据, 结果表明RPA-GRU模型与GATM模型在可度量数量信息识别和关联上分别获得97.58%与97.86%的F1值, 比表现最好的基线模型分别高出2.17%与1.74%, 验证了所提出模型的有效性.  相似文献   

17.
从漏洞信息当中抽取结构化信息对于安全研究而言有重要意义。安全研究者常需要在大规模的CVE数据中按特定要求进行筛选,或对漏洞进行自动化的分析测试。然而现有的CVE数据库中只包含了非结构化的文本描述和并不完备的辅助信息。从描述文本抽取结构化的信息能帮助研究者更好地组织与分析CVE。总结漏洞描述包含的七种核心要素,为结构化抽取建立模型,并将信息抽取转换为一个序列标注模型,构建数据集对其进行训练。实验表明,该模型能够以较高的准确率从CVE文本中抽取出各类关键信息。  相似文献   

18.
面对海量的非结构化时态信息,构建了在分布式环境下的数据存储模型,并在此基础上提出一种基本的时态数据处理方法。使用Hadoop平台下的分布式、非结构化数据库HBase对海量时态数据进行存储,构造以时态集合为时态存储单元的时态数据存储模型;针对分布式处理特征和时态集合数据类型,提出一种在Map/Reduce编程计算模式下进行海量时态信息关系演算的实现方法;通过扩展时态区间关系运算,实现以时态集合为基本时态数据操作对象的交、并等关系运算。以医疗时态数据作为研究实例,表明了所提出的时态数据存储模型和关系演算方案在分布式应用系统下的适用性。  相似文献   

19.
基于ORACLE数据库的多媒体数据SQL级操作探究   总被引:1,自引:0,他引:1  
探索ORACLE数据库平台下多媒体数据在SQL级直接操作的可行性.以Oracle interMedia为背景,运用多媒体数据PL/SQL API实现多媒体数据文件存取.虽然在关系数据库中对多媒体数据即非结构化数据进行操作时,和结构化数据的处理方式不同,但在ORACLE数据库平台下将基本sQL和多媒体数据PL/SQL API整合运用,屏蔽了多媒体数据处理的复杂性,对外呈现出一致的SQL级操作是可能的.在ORACLE10g的数据库平台上,通过分析Oracle interMedia体系结构和多媒体数据的特点以及在ORACLE中的存储方式,探索在SQL级实现常规结构化数据类型与表示多媒体内容的非结构化数据类型统一操作的可行性和实现途径.  相似文献   

20.
病情自述是网络疾病咨询中普遍的信息形式。为了从这些不规范的数据中发现隐含疾病知识和用户语义提出一种无监督学习方法构建知识图谱,并基于此进行疾病辅助诊断。从同一疾病的病情自述提取特征关键词,使用特征关键词的概率关联和语义关联构建特征关联网络。在特征关联网络中找出描述疾病时常用的特征团模式,基于特征团的语义关系构建知识图谱;从知识图谱上抽取结构化特征,利用结构化特征与病情自述文本的Jaccard系数完成病情自述的文本表示;利用SVM实现病情自述的分类识别,结果分类的微平均和宏平均都在80%以上。研究能够用于疾病结构化知识发现和用户意图分析,初步诊断病情自述疾病类型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号