期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

潘小燕孙承杰刘远超王晓龙《微计算机信息》2008,24(18)

表格作为网页的一部分,蕴含丰富的信息,因而表格的识别工作已经成为了一个很值得研究的课题.把表格识别看作是一个分类问题,提出了一种新的用最大熵模型来解决这一问题的方法.实验证明,该方法对表格识别的F度量能够达到95.82%. 相似文献

2.

宋鹏程单丽莉孙承杰林磊《中文信息学报》2021,35(11):109

该文提出了一种基于查询路径排序的知识库问答系统。为了将简单问题与复杂的多约束问题统一处理,同时提高系统的准确性,该系统采用基于LambdaRank算法构建的排序模型,对查询路径按照与问题的相关度大小进行排序,选择与问题相关度最高的路径用于抽取答案。同时,该系统还应用了一种融合方法以提高实体识别的准确性。该文所构建的系统在CCKS2019 KBQA任务与CCKS2020 KBQA任务上均取得了较好的效果。相似文献

3.

一种面向微博用户的标签推荐方法

刘秉权孙承杰林磊陈渊《智能计算机与应用》2011,(5):21-26

首先对国内微博平台的信息进行了综合分析,主要介绍了微博信息的定义,在错综复杂的微博信息中哪些信息比较重要,以及这些微博信息包含哪些详细的内容,是如何组织的.然后选取新浪微博平台作为研究对象,利用新浪微博API设计了爬虫程序,抽取用户信息；以用户的关注人数、粉丝数和发布的微博数为标准对用户信息进行了定量分析.最后根据分析... 相似文献

4.

一种面向微博用户的标签推荐方法

陈渊林磊孙承杰刘秉权《电脑学习》2011,1(5)

首先对国内微博平台的信息进行了综合分析,主要介绍了微博信息的定义,在错综复杂的微博信息中哪些信息比较重要,以及这些微博信息包含哪些详细的内容,是如何组织的。然后选取新浪微博平台作为研究对象,利用新浪微博API设计了爬虫程序,抽取用户信息;以用户的关注人数、粉丝数和发布的微博数为标准对用户信息进行了定量分析。最后根据分析结果,针对不同特征的用户群体提出了相应的标签推荐方法。相似文献

5.

一种面向微博用户的标签推荐方法

陈渊林磊孙承杰刘秉权《电脑学习》2011,(3):21-26

首先对国内微博平台的信息进行了综合分析,主要介绍了微博信息的定义,在错综复杂的微博信息中哪些信息比较重要,以及这些微博信息包含哪些详细的内容,是如何组织的。然后选取新浪微博平台作为研究对象,利用新浪微博API设计了爬虫程序,抽取用户信息;以用户的关注人数、粉丝数和发布的微博数为标准对用户信息进行了定量分析。最后根据分析结果,针对不同特征的用户群体提出了相应的标签推荐方法。相似文献

6.

显式融合词法和句法特征的抽取式机器阅读理解模型

闫维宏李少博单丽莉孙承杰刘秉权《计算机系统应用》2022,31(9):352-359

预训练语言模型虽然能够为每个词提供优良的上下文表示特征,但却无法显式地给出词法和句法特征,而这些特征往往是理解整体语义的基础.鉴于此,本文通过显式地引入词法和句法特征,探究其对于预训练模型阅读理解能力的影响.首先,本文选用了词性标注和命名实体识别来提供词法特征,使用依存分析来提供句法特征,将二者与预训练模型输出的上下文表示相融合.随后,我们设计了基于注意力机制的自适应特征融合方法来融合不同类型特征.在抽取式机器阅读理解数据集CMRC2018上的实验表明,本文方法以极低的算力成本,利用显式引入的词法和句法等语言特征帮助模型在F₁和EM指标上分别取得0.37%和1.56%的提升. 相似文献

7.

基于结构挖掘的论坛检索模型

杨小锐林磊孙承杰刘秉权《中文信息学报》2011,25(1):98-104

随着互联网的发展,网络论坛中蕴涵着数量巨大且质量较好的知识资源。因此对论坛信息进行有效地检索具有重要应用价值。该文研究适合于论坛数据的检索模型,以期能够充分利用论坛平台累积的海量数据来满足用户的信息需求。针对论坛页面和普通新闻页面的区别,该文提出关键帖抽取算法和论坛线索重构算法来选择论坛中信息含量丰富的帖子,并利用得到的帖子构建检索系统。实验表明该文提出的方法能够有效地提升论坛检索系统的效果。相似文献

8.

一种用于基因名字规范化的多层歧义消解框架 总被引：1，自引：0，他引：1

孙承杰王晓龙林磊刘远超《自动化学报》2009,35(2):193-197

灵活的基因名字命名方式使基因名字具有严重的歧义, 这已成为对生物医学文献进行深层自动文本挖掘的主要障碍之一. 基因名字规范化是解决这一问题的有效途径. 本文提出了一种多层歧义消解框架来完成基因名字规范化任务. 基因名字规范化过程中不同阶段有不同的歧义情形, 在本文提出的框架中, 针对这些情形采用了有针对性的解决策略, 包括: 基于词典的基因名字检测, 基于机器学习方法的候选选择以及基于语义的歧义消解. 试验表明, 我们的方法能够在BioCreAtIvE2006的基因名字规范化测试集上取得0.746的F度量. 相似文献

9.

基于注意力机制的句子排序方法

栾克鑫杜新凯孙承杰刘秉权王晓龙《中文信息学报》2018,32(1):123-130

句子排序是多文档自动摘要和答案融合任务的关键技术,其效果直接影响摘要或者答案融合结果的可读性。作为句子排序的重要依据,语义逻辑关系的准确度对于排序结果的可读性有很大影响。为此,该文提出了引入注意力机制的句子排序模型,以增强句子语义逻辑关系的捕获能力,进而获取句子的合理排序。实验结果表明,在句子排序任务中,引入注意力机制的句子排序模型明显优于基线方法。相似文献

10.

《知网》在命名实体识别中的应用研究 总被引：1，自引：0，他引：1

郑逢强林磊刘秉权孙承杰《中文信息学报》2008,22(5):97-101

命名实体识别是自然语言处理领域的一项基础研究,它对于语言的深层处理有重要意义。该文以最大熵模型为基础来进行名实体识别,提出了基于《知网》的两种改进策略来增强模型的泛化性能。第一种策略是将《知网》中词的义原作为特征加入到最大熵模型中;第二种策略是利用《知网》来计算最大熵模型中词特征之间的概念相似度。在北京大学《人民日报》语料上的实验结果表明第一种策略可以有效地提高名实体识别的性能,第二种策略的改进效果不明显。相似文献