首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
石翠 《软件》2014,(2):75-78
结合条件随机场与伯克利句法分析器对中文专利文献中的单层并列结构进行识别。在经过分词和词性标注的中文专利语料的基础上,分别运用条件随机场和伯克利句法分析器对专利语料中的单层并列结构进行识别,提取两种机器模型相同的和识别结果中满足相应规则的并列结构识别结果。实验结果表明,该方法有效的识别了专利文献中的单层并列结构,取得了73.09%的F值。  相似文献   

2.
该文在中文专利语料的基础上,统计分析了中文专利文献中有标记并列结构的内部特征和外部特征。内部特征主要考察了中文专利文献中有标记并列结构的并列标记、并列结构内部分析和词性分布等。外部特征主要统计了可能的边界特征词,并分析了有标记并列结构在中文专利文献中出现的外部环境。  相似文献   

3.
4.
专利文献翻译中并列结构的处理   总被引:1,自引:0,他引:1       下载免费PDF全文
针对专利文献翻译中的复杂并列结构的处理,提出了一种预处理和后处理的方法——拆分合并法。它弥补了统计翻译系统在复杂结构方面的劣势,同时保留统计翻译在经验句式、人力成本等方面优于规则系统的特点。实验表明,这种方法稳定地提高了翻译系统的准确率。此外,它独立于具体的统计翻译系统,可以方便地移植到不同的统计翻译系统上。  相似文献   

5.
石翠  王杨 《软件》2014,(4):68-70
本文利用中文专利语料库,对中文专利文献中的并列结构进行了分析,主要分析了中文专利文献中并列结构的依存特征。根据中文专利文献中并列结构的依存特征,总结出并列结构依存处理规则,并根据并列结构依存处理规则对中文专利文献的依存分析结果进行了规则后处理,规则处理后提高了识别的准确率。  相似文献   

6.
基于多层条件随机场的中文命名实体识别   总被引:2,自引:0,他引:2       下载免费PDF全文
命名实体识别属于自然语言处理的基础研究领域,是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。主要研究中文命名实体中对复杂地名和复杂机构名的识别,提出一种基于多层条件随机场的命名实体识别的方法。对大规模真实语料进行开放测试,两项识别的召回率、准确率和F值分别达到91.95%、89.99%、90.50%和90.07%、88.72%、89.39%。  相似文献   

7.
面向专利文献的中文分词技术的研究   总被引:1,自引:0,他引:1  
针对专利文献的特点,该文提出了一种基于统计和规则相结合的多策略分词方法。该方法利用文献中潜在的切分标记,结合切分文本的上下文信息进行最大概率分词,并利用术语前后缀规律进行后处理。该方法充分利用了从大规模语料中获取的全局信息和切分文本的上下文信息,有效地解决了专利分词中未登录词难以识别问题。实验结果表明,该文方法在封闭和开放测试下分别取得了较好的结果,对未登录词的识别也有很好的效果。  相似文献   

8.
9.
在分词模型跨领域分词时,其性能会有明显的下降。由于标注军队遗留系统开发文档语料的工作比较复杂,本文提出n-gram与词典相结合的中文分词领域自适应方法。该方法通过提取目标语料的n-gram特征训练适应特征领域的分词模型,然后利用领域词典对分词结果进行逆向最大匹配的校正。实验结果表明,在军队遗留系统相关文档语料上,该方法训练的分词模型将F值提高了12.4%。  相似文献   

10.
王昌厚 《福建电脑》2012,28(2):89-89,93
本文使用条件随机场模型解决中文命名体识别问题,探讨了特征的选择对命名体识别的影响。实验证明,词的边界特征、构词特征(词的首字和尾子)、词性特征、词的上下文特征(尤其是前缀和后缀)对识别命名体具有非常大的帮助。  相似文献   

11.
基于移进归约的句法分析系统具有线性的时间复杂度,因此在大规模句法分析任务中具有特别实际的意义。然而目前移进归约句法分析系统的性能远低于领域内最好的句法分析器,例如,伯克利句法分析器。该文研究如何利用向上学习和无标注数据改进移进归约句法分析系统,使之尽可能接近伯克利句法分析器的性能。我们首先应用伯克利句法分析器对大规模的无标注数据进行自动分析,然后利用得到的自动标注数据作为额外的训练数据改进词性标注系统和移进归约句法分析器。实验结果表明,向上学习方法和无标注数据使移进归约句法分析的性能提高了2.3%,达到82.4%。这个性能与伯克利句法分析器的性能可比。与此同时,该文最终得到的句法分析系统拥有明显的速度优势(7倍速度于伯克利句法分析器)。  相似文献   

12.
为了减少企业专利侵权案件的发生和控制整个技术市场,亟需企业与科技情报检索部门精诚合作,协同创新,尝试开展具有企业特色需求和个性化专题的云计算情报检索分析,制定出云计算相关技术专利的发展战略。  相似文献   

13.
观点承载着文本的重要信息,而比较句是观点评论中一种常见的句式现象。针对中文比较句识别问题,该文提出了一种基于规则与统计相结合的方法并进行实验。该方法先对语料及其分词结果进行规范化处理,再通过基于比较特征词词典与句法结构模板、依存关系相结合的方法进行泛提取。然后设计一种CSR规则提取算法,并利用CRF挖掘实体对象信息及语义角色信息。最后利用SVM分类器,选取不同特征维数,找到使性能达到最优的特征形式完成精提取。  相似文献   

14.
多agent系统的一个关键性的问题就是多agent之间的协作,即一组agent需要选择出一个联合动作,使得整体效用最大化。该文提出了基于值规则的协作图,并改进了变量消减算法,使用它们可以实现多agent在通信条件受到限制的离散状态空间里进行动作选择。  相似文献   

15.
利用国家知识产权局互联网检索数据库SooPat专利数据库,采集广东省惠州市从2004年1月1日至2013年12月31日期间的专利文献,建立广东省惠州市专利申请数据库。再选择国家知识产权局专利信息服务平台分析系统分别从专利申请总量、IPC技术类别分布、专利申请人分布和惠州市专利申请趋势等方面,对广东省惠州市专利申请进行细致、严密、综合的竞争力分析,并从专利文献中提取有用信息,为企业实现其特有的经济价值。  相似文献   

16.
中文专利文献中含有大量领域术语,对这些术语进行自动识别是信息抽取、文本挖掘等领域的重要任务。该文提出了基于专利文献标题的术语词性规则自动生成方法以及针对候选术语排序的TermRank算法。该方法首先从大量的中文专利文献标题中自动生成词性规则;然后利用生成的词性规则对中文专利文献正文部分进行规则匹配获得候选术语表;再利用提出的TermRank排序算法对候选术语表排序,最终得到术语列表。通过在9 725篇中文专利文献数据上实验,证实了该方法的有效性。
  相似文献   

17.
电子商务环境下供应链协作策略研究综述   总被引:1,自引:0,他引:1  
随着电子商务的迅速发展,大量的电子商务市场也应运而生,为供应商提供了新的销售渠道,也同时改变了供应链的结构和模式,传统的供应链协作理论在新的形势下遇到了挑战。越来越多的学者开始把注意力转向电子商务环境下的供应链理论的研究,因此,文章基于目前这一形式,阅读大量关于这方面的最新文献,对目前的研究进展进行了总结,并提出了今后研究的方向和需进一步研究的问题。  相似文献   

18.
基于《知网》的中文信息结构抽取研究   总被引:2,自引:0,他引:2  
文章提出了一种在真实文本中抽取中文信息结构的方法—利用大规模基于语义依存关系的语料库对《知网》的中文信息结构模式进行训练,用这些带概率的模式作为规则建立部分依存分析器,从而从真实文本中最大限度地抽取符合知网中文信息结构定义的短语。该研究除了对将要建立的基于语义依存关系的语言模型是个有益的补充外,对于文本理解、对话系统甚至语音合成中的重音预测、韵律建模等等方面都有十分广阔的应用前景。  相似文献   

19.
指出关联规则在中药数据分析中的难点,据此提出了一种改进的Apriori算法--Apriori 算法;最后,以治疗感冒的中药专利数据集为测试数据,进一步验证算法的有效性和实用性.结果表明,此算法能够有效地从治疗感冒的专利数据库中发现布尔型与数值型关联规则,为开发新的感冒中药提供配伍依据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号