首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 515 毫秒
1.
提出了一种基于句法模式的语义关系抽取方法,用于从术语词典中抽取语义关系.该方法以句法模式为中心,结合了自然语言处理技术和统计的思想,充分利用术语词典文档中的句法信息,通过抽取包含着语义关系信息的句法模式,并将其与词典文本进行近似匹配以达到抽取语义关系的目的.实验结果表明,该方法可以有效地从术语词典中抽取多种语义关系.  相似文献   

2.
针对中医领域,提出了一种基于条件随机场的术语抽取方法,该方法将中医领域术语抽取看作一个序列标注问题,将中医领域术语分布的特征量化作为训练的特征,利用CRF工具包训练出一个领域术语模型,然后利用该模型进行术语抽取.选择<名医类案>作为中医领域文本进行术语抽取实验,取得了较好的效果,准确率为83.11%,召回率为81.04...  相似文献   

3.
针对领域术语抽取中含字长度较大的术语被错误切分的问题,本文提出一种基于术语长度和语法特征的统计领域术语抽取方法。本方法在利用机器学习抽取候选术语时,加入基于术语长度和语法特征的约束规则;在使用统计方法确定候选术语的领域性时,充分考虑词长比这一概念的重要性,将其作为判断术语领域性的重要权值。实验表明,提出的方法能够正确抽取含字长度较大的领域术语,抽取结果的准确率和召回率相比以往的方法有所提高。  相似文献   

4.
为了提高中文领域本体概念抽取的准确率和召回率,提出一种多策略的中文领域本体概念抽取方法。该方法使用模式匹配法改进原有的单字合并法,经词性过滤和缺陷检测筛选出概念集组成用户词典,并送入概念抽取系统进行二次分词获得候选概念集;利用词频-逆向文本频率(TFIDF)方法和信息熵融合得到TFIDFE方法,计算概念权重以获得领域概念集。实验结果表明,该方法在领域术语抽取的准确率、召回率和F值上均有较好的效果。  相似文献   

5.
一种基于树核函数的半监督关系抽取方法研究   总被引:1,自引:1,他引:0  
为了解决传统的半监督关系抽取算法易产生的"语义变异"问题,提出一种新的基于树核函数的半监督关系抽取算法。该算法主要采用树核函数和种子集约束扩展两个策略,弱化"语义变异"现象带来的关系抽取不够准确的问题,提高关系识别的正确率。在基准数据集PopBank上的试验研究表明,提出的使用约束机制扩充种子集的半监督学习方法在4个评价指标上(Precision, Recall, F-measure, Accuracy)均优于常用的两种关系抽取方法,从而验证了该算法与其他算法相比能够具有较好的关系抽取能力。  相似文献   

6.
设计了一种中韩科技信息综合平台中的翻译辅助系统.首先,依据关键词确定的组词特证获取候选术语,并使用互信息评估候选术语以实现术语自动提取.其次,将已有术语、抽取到的新术语、术语译文和历史翻译记录等信息存储到系统数据库中建立术语库.最后,设计翻译工作者的用户接口,使其通过该接口获取已有术语的译文信息、新术语的相似译文信息和译文记忆库为基础的历史翻译数据.测试结果表明,本文设计的术语自动抽取功能和辅助译文生成功能达到了预定的设计目标,术语自动抽取算法召回率达到61.8%,结合优化方法进行优化后达到66.9%;辅助译文生成平均延时为0.031s,MRR为0.951,测试结果满足用户需求.  相似文献   

7.
结构化电子病历数据录入方法   总被引:5,自引:0,他引:5  
以HL7 CDA R2标准作为临床信息的结构化表达方式,提出了一种兼容标准术语的结构化录入(SDE)方法,用来解决由于标准术语的概念划分较粗,不足以通过标准术语编码的结构化内容重建自然语言满足临床日常信息交换需求的问题.该方法抛弃传统的通过标准化结构化结果重建叙述性内容的模式,采用同步生成叙述性内容和标准化结构化内容的模式,因而叙述性内容的生成不受限于结构化内容标准术语的概念划分,从而实现了在结构化数据录入中应用标准术语满足计算机可处理的同时满足临床日常工作对于自然语言信息的人工阅读需要.该方法为标准化结构化电子病历信息模型的数据获取兼容叙述性病历提供了一种新的解决思路.  相似文献   

8.
首先介绍文献术语的重要性和分布情况,归纳常用的文献术语抽取方法,进而提出一种从英汉平行语料库中自动抽取术语的算法.主要采用基于字符长度的改进的统计方法对平行语料进行句子级的对齐,并对英文语料和中文语料分别进行词性标注.统计已对齐和标注的双语语料中的名词和名词短语生成候选术语集.然后对每个英文候选术语计算与其相关的中文翻...  相似文献   

9.
该文面向本体关系集合的自动构建,提出一种基于百科词条的本体概念聚类方法,用于发现领域概念之间的语义关系。在给定领域本体概念集合的条件下,该方法首先获取相关的百科词条并建立每一概念的向量模型,然后根据距离判别法进行概念聚类,得到概念间的相近关系。采用该方法对3个领域中的领域概念集合进行聚类,实验结果表明,该文方法比传统聚类算法有更好的聚类结果,有助于概念间关系的自动获取和领域本体自动构建。  相似文献   

10.
领域本体在信息抽取系统有着重要作用。该文介绍了本体、领域本体的基本概念,并探讨了领域本体与信息抽取的关系。提出了信息抽取系统中领域本体的设计准则和实施步骤,实施步骤包括领域本体需求分析、收集本体信息、构建领域本体框架、形式化编码、确认和评价等。在信息抽取原型系统中实现了显示器领域本体,并将该领域本体应用到信息抽取中的命名实体识别、抽取模式获取和主题概念提取等任务中,应用结果表明该方法、步骤是可行的。  相似文献   

11.
以吉林地区所产中华亚种沙棘为主要研究对象,采用微波辅助提取沙棘籽油。以提取时间、料液比、微波功率为单因素考察条件,在单因素实验基础上,采用响应面法对微波辅助提取沙棘籽油的工艺进行优化。实验得出最佳提取工艺条件为提取时间26min,料液比1:12,功率622W,在此条件下重复三次实验,得到沙棘籽油的提取率为0.307%±0.005%,为预测值的98.71%。与预测值基本一致。该研究优化了微波辅助提取沙棘籽油的提取工艺,为沙棘籽的进一步开发利用提供理论基础。  相似文献   

12.
基于自扩展与最大熵的领域实体关系自动抽取   总被引:2,自引:2,他引:0  
实体关系自动获取是信息抽取的难题之一。本文提出自扩展算法和最大熵机器学习算法相结合的方法,以旅游领域为研究对象进行实体关系的自动抽取。首先利用自扩展算法自动获取能体现实体对间大类关系的语义词汇,该词汇作为特征加入最大熵机器学习算法的特征集,并设定阈值实现训练语料的自动标注;然后使用最大熵机器学习算法对训练语料进行学习,构建实体关系抽取的分类器,实现实体关系的自动获取。在收集600篇旅游领域语料的基础上进行实验,4大类实体关系的抽取获得了较好的结果,其中地理位置关系和时节关系的F值分别为82.56%和81.17%。实验结果表明:在人工干预较少的情况下,加入实体对间的语义词汇能有效提高抽取效果。  相似文献   

13.
无毒高蛋白质棉仁粉的研究   总被引:3,自引:0,他引:3  
研究了棉籽粕精制和萃取脱毒工艺,制造出无毒高蛋白质棉仁粉,把它添加到谷物食品中,可大大提高其蛋白质含量,有利于人民身体健康。  相似文献   

14.
采用索氏提取法提取了内蒙产白芥子的白芥子油。结合单因素考察和正交试验优化了提取条件,确定白芥子油的最佳提取条件为:石油醚(沸程60~90℃)作为提取剂,提取温度为95℃,提取时间为4h,白芥子质量浓度为0.125g/mL。实验结果表明:在最佳提取条件下,白芥子油提取率可达35.4%。GC/MS分析结果表明:白芥子油的脂肪酸主要由油酸、亚油酸、亚油酸和芥酸组成。  相似文献   

15.
The extraction of geometric primitives from an im-age is one of the basic tasks of computer vision.Straight lines and ellipses are common components inmost underwater images(such as mines and torpedoimages)which are proposed by computer recognitionsystems.The Hough Transform(HT)is the mostpopu-lar technique for extracting geometric shapes.Explana-tions of HT can be found in most pattern recognitionbooks.In brief,the principle concept of the HT is todefine a mapping between an image space a…  相似文献   

16.
低噪声轮胎花纹结构参数辨识   总被引:3,自引:0,他引:3  
基于轮胎花纹噪声的发声机理 ,对优秀的低噪胎花纹图案进行了分析 ,分别辨识出该轮胎花纹的关键结构参数 ,包括花纹块、花纹槽的大小和比例、花纹的基本节距数以及节距排列。其中花纹块和花纹槽的大小是辨识的核心 ,运用轮廓提取和种子填充算法等图像处理方法 ,将轮胎花纹由不规则的花纹块转化为矩形块 ,通过累加填充图案的像素值 ,统计出花纹块和槽的面积 ,并利用胎噪声仿真分析软件 (TNS)进行频域分析 ,为轮胎的低噪声优化研究和生产低噪胎产品提供了依据。  相似文献   

17.
针对当前信息检索服务中存在的固有缺陷,提出了一种基于用户桌面信息抽取的个性化推荐方法.详细介绍了通过用户桌面资源信息抽取建立长期用户模型,以及通过工作场景信息抽取建立短期用户模型的算法.长期用户模型提供了完整全面的用户兴趣偏好信息,短期用户模型则为预测用户当前信息需求提供了依据.实验结果表明,基于用户桌面信息抽取的个陛化推荐服务能较好地预测用户当前需求、具有良好的推荐效果.  相似文献   

18.
目标识别是现代雷达领域的一个难点问题.本文基于滑动相关理论,结合超宽带(UWB)雷达能获取目标高分辨力距离像的特性,提出了一种基于滑动相关的UWB雷达目标识别方法.该方法避免了对目标极点的提取,仿真结果表明有较好的识别效果,且算法简明,易于实现.  相似文献   

19.
超临界CO2萃取黑加仑油   总被引:2,自引:0,他引:2  
本文提出了用超临界 CO_2萃取黑加仑油的方法,考察了压力、温度对黑加仑油在 CO_2中溶解度的影响,分析了萃取条件与油品质量的关系,并综合得出了超临界 CO_2萃取黑加仑油的最佳条件.  相似文献   

20.
以w3c文档对象模型(DOM)为基础,利用元搜索引擎原理实现了一个互联网新闻自动抽取系统.该系统通过搜索引擎获取相关新闻的web页面,分析后得到其元数据,然后利用元数据表现出来的信息进行新闻正文抽取,该方法不依赖于原网页结构,不需要人工干预,是自动、可靠、通用的方法.试验表明,该抽取方法有着较高的准确率,平均可达到96%以上.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号