共查询到20条相似文献,搜索用时 671 毫秒
1.
介绍了本体Ontology的概念和理论知识,提出一种基于本体的Web信息检索模型.该模型利用本体技术对Internet上的各类信息进行领域分类,规范用户信息检索模式,以达到快速、准确找到用户所需信息的目的. 相似文献
2.
电子商务环境下产品本体构建技术研究 总被引:1,自引:0,他引:1
产品本体通过构建产品类层次及其属性描述为交易双方提供了对产品共享的通用的理解。针对目前电子商务中标准产品本体缺乏产品属性描述的问题,根据电子商务网站中产品信息多以表格形式组织和描述的特点,提出以联合国标准产品与服务分类代码(UNSPSC)为核心本体,结合表格处理技术的半自动产品本体构建方法。以Web表格为对象,对Web表格的识别、表格规范化、单元产品本体及全局产品本体建立进行了研究。这种半自动的本体建立方法可以解决电子商务中的产品信息模型因缺乏标准化的属性描述而产生不一致性,实现对核心产品本体的扩展和补充。 相似文献
3.
基于本体的Web分类技术研究 总被引:2,自引:3,他引:2
主要提出了一种基于本体的抽象的Web挖掘模型。首先利用本体的方法表示出要挖掘的领域,然后把从用户处收集来的数据转换成表格;最后再根据定义和公式来进行知识发现。抽象的Web挖掘模型可以提取出语义Web中隐藏在大量信息背后的近似概念,来实现知识发现。 相似文献
4.
从Web中提取中文本体非分类关系的方法 总被引:2,自引:0,他引:2
为了有效地学习本体中的非分类关系以协助知识工程师构建领域本体,提出了一种在中文领域本体学习环境中自动获取概念之间非分类关系的方法,该方法以Web为数据源来提取候选关系并计算信息分布的统计特征,把动词作为发现非分类关系的中心点,把领域相关的动词作为种子来检索领域相关概念并用来标记相应的关系.该方法的学习结果是一个多级分类关系和非分类关系组成的语义体系.最后,通过对"癌"本体相应关系的提取及其性能分析,表明了该方法的学习结果和性能. 相似文献
5.
6.
面向Web信息资源的领域本体模型自动构建机制的研究 总被引:1,自引:1,他引:0
领域本体的构建是本体工程研究与应用的重要内容。面向网络Web信息资源,获取领域相关文本信息,通过对文本的概念分析,构建领域本体模型。提出一套本体自动构建机制,该本体构建基于数据挖掘和机器学习技术,内容主要包括基于贝叶斯(Bayes)分类原理;提出多个分类器方式的概念分类过程和算法;提出概念关联分析和概念自学习算法,建立本体原型;提出面向OWL本体模型的转换映射机制,构建基于OWL的本体模型。此外,还提出了从网络资源获取、领域本体建模到本体实施应用的一套完整的本体构建和应用实施的解决方案。 相似文献
7.
提出一种通用的多策略本体学习框架,通过对Web上各专业领域文档集进行挖掘来实现本体自动构建。讨论本体学习中本体概念的抽取、概念之间语义关系的抽取和分类体系的自动构建等关键技术,通过实验对算法进行测试和评价。由于集成了多种机器学习算法,该方法在概念抽取和语义关系学习方面具有更高的准确性,采用通用本体WordNet和HowNet作为语料库,可适用于不同的专业领域。通过按需获取Web文档,该方法能实时生成本体。 相似文献
8.
Web表格信息抽取模型的设计与实现 总被引:1,自引:0,他引:1
Web表格作为一种简洁有效的数据信息表达方式,已广泛应用于Web页面中.现提出一种基于表格结构的Web表格信息抽取模型,该模型主要有表格定位模块、表格结构预处理模块和表格信息抽取与重构模块三个模块组成,根据Web表格的结构标记和自定义的启发式规则来抽取表格信息.实验结果表明该模型能够很好地应用于Web表格信息的抽取. 相似文献
9.
基于领域本体的语义标注方法研究 总被引:3,自引:0,他引:3
介绍了语义Web.本体以及语义标注的基本概念,对语义标注方法以及现有技术工具进行了简单地说明和分析,提出了一种基于领域本体的语义标注方法,并结合石油产品领域的本体对该方法进行了实例说明.该方法通过分析文档的特征词汇,使用基于领域本体的空间向量模型方法建立词汇与本体概念之间的映射.采用这种方法对文档进行语义标注后,可以把文档隐含的语义信息显式的表现出来,这样数据库内部文档之间就具有了语义关联关系,为检索的智能推理提供基础. 相似文献
10.
11.
基于本体的Web挖掘分类方法及应用 总被引:1,自引:0,他引:1
为了解决Web挖掘系统中信息共享的语义问题,应用本体技术,在传统Web挖掘分类方法的基础上提出了一种基于本体的Web挖掘分类方法.实践表明,该方法能有效地解决传统Web挖掘系统中诸如"新项目"等问题,并为用户提供基于本体属性的更细粒度、交互式的语义Web信息服务. 相似文献
12.
13.
为了解决网页信息的自动抽取,该文提出了一种基于视觉特征和领域本体的Web信息抽取算法.该算法以基于领域本体的信息抽取为基础,根据网页的视觉特征来准确划定信息抽取区域,然后结合DOM树技术和抽取路径的启发式学习,获得Web贞面中信息项的抽取路径.通过信息项的抽取路径自动生成信息项的领域本体,通过信息项的领域本体解析出信息项的抽取规则.使用本算法来进行Web信息的抽取,具有查全率与查准率高、时间复杂度低、用户负担较轻和自动化程度高的特点. 相似文献
14.
基于本体的Web服务发现方法研究 总被引:3,自引:1,他引:2
针对传统Web服务发现准确率低下的问题,提出一种基于本体的服务发现方法.该方法首先基于领域本体构建了Web服务描述模型,并应用OWL-S描述Web服务增强了Web服务的语义信息,然后从基本信息语义相似度、功能语义相似度等方面综合计算Web服务相似度,最后基于Web服务相似度进行请求服务与目标服务的匹配.给出了基于本体的服务发现相关算法,并设计了基于三层架构的服务发现原型系统.实验结果表明,该方法可提高Web服务发现的查全率及查准率. 相似文献
15.
面向Web结构化信息处理的汉语知识库构建研究 总被引:2,自引:0,他引:2
对Web结构化汉语信息处理中的知识需求进行了分析,介绍了目前有影响的汉语语义资源和本体知识,给出了面向Web结构化信息处理的汉语知识库组成模型及构建方法,并在Deep Web研究中对该模型进行了应用验证.该研究旨在使计算机更全面有效地对特定领域的web结构化信息进行处理,对本体的深入研究也有一定的参考价值. 相似文献
16.
在癌症分类研究领域,高维、高冗余、类分布不平衡的基因表达数据如何进行特征选择与分类模型构建一直是影响分类准确率的难点。为了提高癌症分类的准确率,提出了基于特征交互与权重集成的癌症分类方法。在特征选择层面,利用多特征对分类信息的增益性交互作用来选出对于标签联合互信息大于单独互信息之和的特征组合,并利用条件互信息选择低冗余的特征,解决基因表达数据的高维、高冗余问题。在分类模型层面,提出结合权重集成反馈机制的二次学习集成模型,综合不同模型对不同类别样本的差异拟合能力,构造不依赖于样本数量的类权重,解决数据类分布不平衡的问题。应用该方法对六种癌症数据进行分类测试,accuracy、sensitivity、precision和F-measure四项指标均稳定在99.39%以上、specificity在94.74%以上,表明该方法能有效提高癌症分类的准确率和稳定性,同时具有对于不同癌症分类的通用性。 相似文献
17.
18.
提出一种基于领域本体的网页分类策略(ODBCS4WP).该策略采用本体描述语言和Web服务技术构建合适的领域本体库,把用户的分类精度要求映射为本体库中的语义相似距离,并确定分类概念;结合网页主题对该领域中的网页进行分类.实验表明,该策略具有良好的分类效果. 相似文献
19.
一种基于改进的权值调整技术数据源分类算法研究* 总被引:1,自引:0,他引:1
针对传统的搜索引擎无法正确搜索到Deep Web中隐藏的海量信息,对Web数据库的分类是通向Web数据库分类集成和检索的关键步骤。提出了一种基于权值调整技术的Deep Web数据库分类方法,首先从网页表单中提取特征;然后对这些特征使用一种新的权重计算方法进行估值;最后利用朴素贝叶斯分类器对Web数据库进行分类。实验表明,这种分类方法经过少量样本训练后,就能达到很好的分类效果,并且随着训练样本的增加,该分类器的性能保持稳定,准确率、召回率都在很小的范围内波动。 相似文献
20.
Deep Web自动分类是建立深网数据集成系统的前提和基础。提出了一种基于领域特征文本的Deep Web分类方法。首先借助本体知识对表达同一语义的不同词汇进行了概念抽象,进而给出了领域相关度的定义,并将其作为特征文本选择的量化标准,避免了人为选取的主观性和不确定性;在接口向量模型构建中,考虑了不同特征文本对于分类作用的差异,提出了一种改进的W-TFIDF权重计算方法;最后采用KNN算法对接口向量进行了分类。对比实验证明,利用所提方法选择的特征文本是准确有效的,新的特征文本权重计算方法能显著地提高分类精度,且在KNN算法中表现出较好的稳定性。 相似文献