首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 81 毫秒
1.
文本分类常采用的算法一般是基于向量比较的分类技术.文本中关键字较多,形成的特征向量维数相当高,因而会导致分类比较处理的运算量太大,而降低维数后又会不可避免地丢失有用信息.将粗糙集理论应用于分类处理过程中可有效地解决此问题.  相似文献   

2.
阐述了中文文本自动分类技术在法制领域中对描述案情的法律文本自动分类的改进及应用,并初步构建了一个中文法律案情文本分类系统.该系统在Visual C 环境上编程实现,通过对测试集中文本实验结果的分析,表明该方法具有一定的分类功能.  相似文献   

3.
4.
文本分类中的特征选择方法   总被引:5,自引:0,他引:5  
文本分类是数据挖掘的一个重要的研究方向.用机器学习方法进行特征选择对文本分类起关键作用。结合的工作,本文从文本的特征表示、特征选择等方而加以阐述.综合了已有和最新的各种基于评估函数的特征选择的方法,评价了它们的优缺点和适用范围。  相似文献   

5.
采取TF-IDF、LDA、位置权重指派与MMR相结合的方式,对不同的句子分配不同的权重.结合Word Embedding模型,分析了在BERT、RoBERTa-wwm-ext等模型测试的分类效果.  相似文献   

6.
文本自动分类是组织和管理文本信息的有力手段,可以在较大程度上解决信息杂乱无章的问题,使用户更容易更准确地定位所需的信息.目前,文本自动分类是信息检索领域中最前沿的研究热点之一,国内外均有大量学者从事这方面的研究.研究组对文本自动分类进行了深入细致的研究,针对文本自动分类目前存在的问题,提出了一些新的模型,大规模数据集上的实验表明该模型性能优异,表现优于很多方法.  相似文献   

7.
中文文本分类的特征选取评价   总被引:9,自引:0,他引:9  
在对中文文本分类的特征选取方法进行综合评价的基础上,对目前比较流行的5种特征选取方法(文档频度DF、互信息MI、信息增益IG、x^2统计X^2、术语强度TS)进行评价,选用Naive Bayes作为文本分类器,对一个中文文本分类语料库进行分类评测.实验结果表明,DF和x^2的分类性能十分接近,处于较好水平;而TS分类性能稍差一些;IG和MI的分类性能与其他相比都有较大的差距.特别是在特征数目少的情况下,MI和IG的结果较差.在特征数目为1000时,MI的F1值为64.60%;IG为69.36%,而DF则达到87.01%.  相似文献   

8.
传统的流形学习局部线性嵌入 (locally linear embedding, LLE) 算法通过欧氏距离来选择邻域,如果数据集选自多个类别,这种距离度量方法无法得到正确的邻域关系。本研究提出一种改进的局部线性嵌入 (modified LLE,MLLE) 算法,该算法通过改进距离矩阵,使得类间的距离大、类内的距离小,从而使得邻域的选择尽量在一个类中。将MLLE算法应用到中文文本分类中,结果表明:与传统的算法比较,MLLE在分类结果可视化效果和识别率等方面都有显著提高。  相似文献   

9.
文本分类系统的评价因素探讨   总被引:1,自引:0,他引:1  
在介绍电子文本自动分类系统的基础上,分析影响文本分类系统评价的若干因素,包括分类算法、测试方法、分类标准、分类标准的理解程度和分类层次等。测试用的分类语料库(超出6000万汉字)是由带人工分类标记的公开发表的《解放日报》和《大众日报》近年各类文章组成,人工分类标记和文章正文均由第三方提供,未作任何修改;语料由各类长短不一、风格各异、体裁不同的文章构成。建议建立权威的分类测试语料库和分类标准,公正客观地评价各分类系统,推进电子文本分类系统的应用。  相似文献   

10.
旅游文本具有呼唤功能、信息功能和表达功能。英译中文旅游文本时,应根据文本类型,考虑中外文化差异和读者接受能力,确定目的语译文的文本功能类型,采取合适的翻译策略:重构译文内容和形式、读者接受与阐释法、类比释义法。  相似文献   

11.
语言和文化有着密不可分的关系,文化需要通过语言加以传承和表达,语言更受到文化的影响。因此翻译既是语言的翻译又是文化的翻译,文化差异对英汉互译具有重要影响。中西方文化差异大都涉及到文化核心成份,即价值观念--亲属关系及称谓、伦理道德、宗教信仰和思维方式等,英汉两种语言处处烙上了价值观的印记。针对上述文化差异,本文通过典型译例探讨应如何避免误译。  相似文献   

12.
为了提高当代汉英互译译者的素质,基于译作实例,结合自身的翻译实践,从高度的责任意识、深厚的语言功底、广博的言外知识、敏锐的感受能力以及相关的计算机及网络知识等方面探讨了新时期译者应具备的素质。认为,译者应与时俱进,从以上各方面不断提高自己的综合素质,确保译文的质量。  相似文献   

13.
模糊性是自然语言的重要特征。语言的模糊性主要表现在4个方面:语音、语调模糊性,词义模糊性,语法模糊性和跨文化交际产生的模糊性。此外,翻译标准的模糊性也导致翻译活动的模糊性。与此同时,模糊语言的客观性对思考一些翻译理论与实践问题有重要意义。  相似文献   

14.
以2012年发布的《十八大报告》为例,结合美国著名翻译学家尤金.奈达的功能翻译理论探索政治文本的英译技巧。功能对等理论认为"翻译是用最恰当、自然和对等的语言从语义到文体再现源语的信息"。(郭,2000)鉴于此,本文从词汇、句法和修辞三个层面分析了《报告》英译本如何再现原文意义。研究发现,在词汇方面,译者可采用注释、重创、词性转化、增译、减译等翻译技巧;在句法方面,政治文本翻译时经常要增补主语、再现源语逻辑关系、实现句子再平衡;修辞上,本文主要研究了在政治文本中较常出现的重复和排比两种手法,此时,为达到文体对等,译文中应保留其形式以在最大程度上体现原文的口吻。应当指出的是,不论采用何种翻译技巧,译者必须首先对政治文本有透彻的理解才能实现"功能对等"。  相似文献   

15.
由于英汉两种语言在词汇和句子表达上的差异,在英汉互译的过程中要充足传达原词语和句子包涵的意见,“精炼词义”和“雕琢句意”的翻译策略是不可或缺的。本文从现代翻译理论的角度阐述了在翻译过程中炼词和琢句的重要性,并以充实的例子作了具体说明。  相似文献   

16.
重点讨论翻译中应实现奈达提倡的功能对等,建立以语篇为翻译单位的翻译模式,并阐述这种功能对等只有在语篇提供的语境下,才能实现在形式、风格、语义、语用等方面自然对等.  相似文献   

17.
网络流行语作为一种特殊的语言形式,具有鲜明的时代特征,并随着网络的普及在人们的日常生活中被越来越多地使用。本文从奈达所提出的“功能对等”翻译理论出发,分析了网络流行语的产生及特点,探讨了这类语言的相关英译策略。  相似文献   

18.
功能翻译三原则在电影标题英译汉中的体现   总被引:1,自引:0,他引:1  
以第73届奥斯卡提名影片标题的英译汉为案例,从文化翻译学的角度分析了标题的三种功能翻译原则与方法,力图从实践中挖掘出在文艺作品标题翻译中实现其深层文化内涵的语境转换方法.  相似文献   

19.
公示语的功能特点与汉英翻译研究   总被引:69,自引:4,他引:69  
公示语是国际化都市、国际旅游目的地语言环境、人文环境的重要组成。公示语所展示的信息状态既有“静态”,也有“动态”;具有指示性、提示性、限制性、强制性四种突出的应用示意功能。对公示语的任何歧意、误解、滥用都会导致不良的社会影响。只有认真探讨英语公示语的功能意义和语言丈化内涵,才能准确而充分地发挥英语公示语在我国深化改革、扩大开放、区域国际化进程中的信息服务作用。  相似文献   

20.
随着全球一体化的发展,企业对外宣传资料的翻译在国际贸易活动中起着越来越重要的作用。好的企业外宣资料是企业对外宣传的窗口。本文主要探讨企业外宣资料英译中出现的一些常见问题。如:中式英语、四字词语的错误表达、忽视概念的文化等值、语篇的逻辑整合等,并就其改进策略提出了自己的一些思考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号