首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 61 毫秒
1.
一种特定领域中文自动摘要系统   总被引:6,自引:3,他引:3  
介绍面向神经网络学习算法这一特定领域的理解型中文自动摘要系统Ladies的研究与实现, 着重分析它不同于其它摘要系统的创新特色及其设计思想, 并给出部分实验结果.  相似文献   

2.
中文自动文摘系统CAAS的研究所实现   总被引:1,自引:1,他引:0  
  相似文献   

3.
汉语自动分词研究综述   总被引:12,自引:0,他引:12  
本文对汉语自动分词的方法进行了概述,并在考察分词精度和分词知识的基础上,提出了一种改进的机械分词方法  相似文献   

4.
随着现代化网络技术的快速发展和广泛使用,信息处理技术获得了很大的发展和进步,对于新闻情报信息来说怎样利用计算机自动地从情报信息中提取摘要变得越来越重要。摘要应该覆盖新闻情报中的最核心的内容以及对用户最有价值的信息,再通过言简意赅的文章段落的表现形式生成,以实现将新闻情报中重要的信息及时、方便的呈现给用户,为用户提供高效的新闻情报分析体验,这种关于新闻情报分析的自动摘要技术对于新闻事业有着重要的意义。  相似文献   

5.
大型问卷调查统计系统的自动生成研究   总被引:1,自引:0,他引:1  
介绍了利用软件需求规格说明自动生成大型问卷调查统计系统的方法.该方法不依赖于特定的问卷表格,几乎能适应各种类型的问卷调查,具有快速与高效的特点.  相似文献   

6.
智能答疑系统的中文分词   总被引:2,自引:0,他引:2  
对词库进行改造的基础上,提出了一种改进的匹配算法,突破了最大匹配分词算法分词的长度限制,提高了中文分词的速度和效率.  相似文献   

7.
为实现多语种生成式自动摘要,基于序列到序列(Seq2Seq)模型提出了一种多语种生成式自动摘要方法.首先,按照传统的多语种自动摘要方法,将中、英、朝3个语种的语料分开训练,得到3个模型,并观察各模型在测试集上的表现; 其次,按照本文提出的多语种自动摘要法,将中、英、朝3种语言的语料放在一起共同训练出一个模型,然后运用该模型分别运行中文、英文、朝文语料的测试集,并观察模型的表现; 最后,用同一个测试集测试模型改进前后的摘要生成效果.实验结果表明,本文方法生成多语种自动摘要的效果与传统方法相近,但因本文方法只用一个模型即可实现多语种自动摘要,因此更具有适用性.  相似文献   

8.
介绍了一种中文自动文摘系统;该系统在高精度的汉语自动分词、关键词自动抽取等算法的基础上,引入了文本结构的统计分析和句间指代关系的识别等技术,使得生成的摘要更加准确、全面、连贯. 该系统适用于科技文献、政论文、公文等实用文体的摘要生成.  相似文献   

9.
中文自动校对系统的研究与实现   总被引:6,自引:0,他引:6  
提出了一种词匹配的语法分析相结合的中文文本自动校对法,采用规则与统计相结合的方法,不使用大规模语料库;而且根据原文的输入方式,用逆向最大匹配和局部语料统计的算法,找出散串,通过词匹配和语法分析处理散串,得到错误串的候选串,通过人机交互的方法对错误串进行自动校正。实验表明,系统的查错率达80%以上,误报率在5%左右,基本满足了应用要求。  相似文献   

10.
介绍了一个比较不同中文分词算法在分词上异同的软件,特别是在歧义词条切分上的异同之处,它包括了容纳各种分词算法的框架结构及其设计,人工干预歧义切分的界面和显示不同分词方法切分统计结果等功能;通过测试统计,本软件基本可以比较出不同的分词方法在歧义切分上的优劣异同之处。  相似文献   

11.
基于统计的中文文本主题自动提取研究   总被引:5,自引:1,他引:5  
文本主题自动提取是一种很有实用价值的技术,它可以有效地浓缩整个web页面,解决无线网络终端由于显示屏太小而无法显示整个网页的难题。总结了目前有关文本主题提取方面的研究成果,设计了一个特征词加权函数,在此函数中考虑了词所跨的段落数因子,同时采用非线性函数描述词长因子和词所跨的段落数因子的作用,并将加权函数应用于主题自动提取。实现了一个中文主题自动提取系统原型,通过对文本集的测试验证了加权函数的有效性。  相似文献   

12.
对于数据信息数量过大的大规模数据库而言,这类数据库的模式、使用方式以及检索方式很难被用户理解,目前,自动模式抽象技术是解决这些问题的最佳方法,模式抽象技术的应用存在一定的局限性,不适合用于中小型规模的数据库中,是适合用于大规模的数据库上。  相似文献   

13.
随着网络技术的发展,文本信息急速增长。文本内容自动处理的相关研究无疑成为最急迫的任务。文章从一些文本内容相关的应用研究开始介绍,其中简要介绍了自动摘要技术、自动标引、信息抽取、文本分类和聚类等,期冀通过对这些应用研究的了解,认识到要重视文本内容的基础研究,从词语层到篇章层的深入分析才是文本内容处理研究发展的最终突破点。  相似文献   

14.
汉语的自动理解与汉语文本的改进   总被引:3,自引:0,他引:3  
汉字的“字”与汉语的“词”单位不一致,给人脑和电脑的理解都带来困难。汉语另外有三种可能的文本“:汉字词式书写”文本“,纯拼音词式书写”文本和“拼音夹用汉字”文本“。拼音夹用汉字”文本最有可能成为走出汉语自动理解困境的最佳路径。  相似文献   

15.
该文介绍了一种基于字符串匹配的中文文本抄袭检测方法——k-grams算法,并指出了选取常用语句降低了其判别的准确性。提出了利用基于统计的中文分词技术实现对k-grams算法的改良。实验结果表明改良后的算法判断抄袭的准确性得到了提高。  相似文献   

16.
水文自动测报系统的研究与应用综述   总被引:1,自引:0,他引:1  
综述国内10多年来水文自动测报系统的研究与应用状况。  相似文献   

17.
Biography videos based on life performances of prominent figures in history aim to describe great men''s life. In this paper, a novel interactive video summarization for biography video based on multimodal fusion is proposed, which is a novel approach of visualizing the specific features for biography video and interacting with video content by taking advantage of the ability of multimodality. In general, a story of movie progresses by dialogues of characters and the subtitles are produced with the basis on the dialogues which contains all the information related to the movie. In this paper, JGibbsLDA is applied to extract key words from subtitles because the biography video consists of different aspects to depict the character''s whole life. In terms of fusing keywords and key-frames, affinity propagation is adopted to calculate the similarity between each key-frame cluster and key-words. Through the method mentioned above, a video summarization is presented based on multimodal fusion which describes video content more completely. In order to reduce the time spent on searching the interest video content and get the relationship between main characters, a kind of map is adopted to visualize video content and interact with video summarization. An experiment is conducted to evaluate video summarization and the results demonstrate that this system can formally facilitate the exploration of video content while improving interaction and finding events of interest efficiently.  相似文献   

18.
中文分词技术是中文信息处理的基础,快速、准确的中文分词方法是进行中文信息搜索的关键。基于N-最短路径的分词算法,需要计算有向图中从起点到终点的所有路径值,分词效率低,将动态删除算法与最短路径算法结合,通过从最短路径中删除部分节点的策略减少搜索路径范围,从而提高分词效率。  相似文献   

19.
为提高关键词自动抽取的准确率,提出了基于字同现频率的关键词自动抽取算法。根据词的位置和文本长度改进TF/IDF算法,由字同现频率计算词的信息量,运用特征加权计算词的权重,选取权重大的词作为关键词。给出了关键词自动抽取的过程,设计了关键词抽取的对比实验,验证该算法的有效性。实验结果表明该算法在准确率和召回率上具有优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号