期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	47篇
免费	7篇
国内免费	7篇

专业分类

综合类	1篇
无线电	2篇
自动化技术	58篇

出版年

2024年	1篇
2021年	3篇
2018年	2篇
2017年	1篇
2013年	1篇
2012年	3篇
2011年	4篇
2010年	2篇
2009年	5篇
2008年	9篇
2007年	2篇
2006年	4篇
2005年	3篇
2004年	3篇
2003年	5篇
2002年	6篇
2000年	4篇
1998年	1篇
1997年	1篇
1986年	1篇

排序方式： 共有61条查询结果，搜索用时 15 毫秒

1 [2] [3] [4] [5] [6] [7] 下一页 » 末页»

大型语言模型：原理、实现与发展

舒文韬李睿潇孙天祥黄萱菁邱锡鹏《计算机研究与发展》2024,(2):351-361

近年来,大型语言模型的出现和发展对自然语言处理和人工智能领域产生了变革性影响.随着不断增大模型参数量和训练数据量,语言模型的文本建模困惑度以可预测的形式降低,在各类自然语言处理任务上的表现也持续提升.因此,增加语言模型的参数和数据规模成为提升系统智能水平富有前景的途径.首先回顾了大型语言模型的基本定义,从模型表现和算力需求的角度给出了“大型”语言模型的界定标准.其次,从数据、算法、模型3个维度梳理了大型语言模型的发展历程及规律,展示了不同阶段各个维度的规模化如何推动语言模型的发展.接着,考察了大型语言模型所表现出的涌现能力,介绍了思维链、情景学习和指令遵循等关键涌现能力的相关研究和应用现状.最后,展望了大型语言模型的未来发展和技术挑战. 相似文献

从视觉到文本: 图像描述生成的研究进展综述

魏忠钰范智昊王瑞泽承怡菁赵王榕黄萱菁《中文信息学报》1986,34(7):19-29

近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像描述生成模型的性能评价和图像描述生成模型的主要发展过程四个方面对相关文献进行介绍和总结。最后,该文给出了几个未来的重点研究方向,包括跨视觉和语言模态的特征对齐、自动化评价指标的设计以及多样化图像描述生成。相似文献

基于知网的概念特征抽取方法 总被引：14，自引：0，他引：14

赵林胡恬黄萱菁吴立德《通信学报》2004,25(7):46-54

文本特征抽取是文本过滤的一项重要基础,但通常采取的用字、词作为特征项的显著缺点是无法表达文本的语义信息,所以本文在向量空间模型的基础上提出了一种以知网为语义知识库、基于语义信息的文本特征项抽取方法。该方法比单纯的词汇信息更能体现文本的概念特征,提高过滤系统的性能;同时还能降低文本向量的维数,减少计算量,提高过滤效率。我们在引入了该方法的中文文本过滤系统上进行的实验结果也充分证实了其有效性。相似文献

文本检索会议简介 总被引：3，自引：0，他引：3

吴立德黄萱菁《计算机科学》2002,29(12):89-91

文本检索简介随着互联网的发展和存贮技术的提高,计算机可读的文本信息也越来越多。据估计,截止到1999年,互联网上已约有5TB的信息容量,其中文字信息约为6TB。然而,要有效地开发利用如此丰富的信息资源并不是轻而易举的事情,因为许多信息往往是规模巨大,实时性强,而且存贮分散;语言混杂,内容广泛;图文并茂,格式灵活,有时还含有一定的拼写错误或传输错误。而对于特定的用户而言,所需要的信息往往只占其中极小的一部分。要从如此规模的网络信息中抽取有用的信息资源,对信息处理的速度和精度将提出极为严格的要求,因而迫切需要对这种形式的混合语料进行更快速高效的处理。在这种情况下,人们越来越多地依靠文本检索工具来寻找自己所需要的信息。文本检索指的是给定文本方式的检索需求,在电子文档库中查找出与指定表达式相匹配的文本,并将出现和包含这些文本的原文作为检索结果返回给用户。相似文献

k-best MIRA和动态k-best MIRA 总被引：1，自引：0，他引：1

曹均阔沈超黄萱菁吴立德《模式识别与人工智能》2009,22(6)

MIRA(Margin Infused Relaxed Algorithm)是一种超保守算法,在分类、排序、回归等应用领域都取得不错成绩.文中在传统MIRA算法基础上进行改进,提出k-best MIRA(K-MIRA)与动态k-best MIRA(DK-MIRA)算法.这两种算法能够根据学习进程自动调整优化约束条件,从而提高算法的收敛速度与性能.将K-MIRA与DK-MIRA用于定义类问题回答中的句子排序任务,取得较为满意的实验结果. 相似文献

基于短语检索和答案排序的列表问题回答方法

袁晓丰邱锡鹏吴立德黄萱菁《中文信息学报》2008,22(5):74-79

文章针对列表类自动问题回答的任务要求,提出了一种基于短语检索和答案距离排序模型的列表类问题回答的方法。该短语检索模型在传统的TF/IDF检索模型上进行改进,提出了利用不同长度短语作为查询词的检索方法,能够返回更多包含正确答案的相关文档;答案的距离排序模型则利用答案与上下文词之间的距离作为排序的依据对答案列表进行排序,可以提高正确答案的排名。这两种模型地提出在一定程度上解决了如何在返回尽可能多的答案的同时保证答案质量的问题。实验结果表明利用这两种模型的列表类问题回答方法对系统的性能有显著提高。相似文献

一种适用于大规模网页分类的快速算法

缪有栋邱锡鹏黄萱菁《计算机应用与软件》2012,29(7):260-263,281

网页分类中存在类别多、训练样本少等问题,一般分类器训练应用效果不佳。为了解决这个问题,提出基于类中心的统计学习方法。在较少人工标注网页的训练集情况下,此方法能取得很好的分类性能并且大幅度加快训练时间,并可以通过加入网页层次目录信息提升推理速度。在第一届LSHTC评测数据集上进行实验,结果表明:基于类中心的统计学习方法拥有较快的训练以及推理速度,并且在正确率上有很强的竞争力。相似文献

基于统计方法的中文姓名识别 总被引：31，自引：6，他引：25

刘秉伟黄萱菁郭以昆吴立德《中文信息学报》2000,14(3):16-24,36

本文介绍一个中文姓名的自动识别系统,该系统使用从姓名样本库和真实文本语料库中得到的大量统计数据,以提高系统识别性能。我们从1994年人民日报中随机抽取100篇文章作为测试样本,实验结果表明,准确率和召回率可同时达到90%以上。相似文献

独立于语种的文本分类方法 总被引：44，自引：4，他引：40

黄萱菁吴立德石崎洋之《中文信息学报》2000,14(6):1-7

文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。本文提出了一个基于机器学习的、独立于语种的文本分类模型,并对模型中的特征抽取、分类器和评价方法进行了详细的介绍。该模型已经在中文和日文两个语种的新闻语料上得到实现,并获得了较好的分类性能。相似文献

10.

利用未标注语料改进实体名识别性能

陈宁昱周雅倩黄萱菁吴立德《中文信息学报》2005,19(2):8-11,27

本文主要介绍了一个利用最大熵进行实体名识别的系统以及所采用的模型和选取的特征。这些特征包括单词本身的词法词态特征和上下文信息。利用这些在任何语言的文本上都极易获得的特征,我们采用最大熵分类器构建了一个基准系统。在此基础上,我们首先通过网络资源建立了实体名词典知识库;并利用词典和基准系统在未标注语料上抽取出现的实体名作为辅助的训练语料;最后再将这些语料加入训练。实验结果表明,辅助的训练语料能够在一定程度上提高系统的性能。相似文献

1 [2] [3] [4] [5] [6] [7] 下一页 » 末页»