首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
在中文文本特别是在社交媒体及问答领域文本中,存在非常多的标点符号错误或缺失的情况,这严重影响对文本进行语义分析及机器翻译等各项自然语言处理的效果.当前对标点符号进行预测的相关研究多集中于英文对话的语音转写文本,缺少对社交媒体及问答领域文本进行标点符号预测的相关研究,也没有这些领域公开的数据集.该文首次提出跨领域中文标点...  相似文献   

3.
AC 《电脑爱好者》2004,(18):33-33
有时从网上下载了一些文本,发现其中的标点都是英文半角的。如果[(\312\307\266\272\272\305\241\242)0(\276\344\272\305\265\271\322\262)]好说,在Word XP/2003[(\326\320\312\271\323\303)58.8(\241\260\262\351\325\322)][(\262\242\314\346\273\273\241\261)0(\276\315\26  相似文献   

4.
虽然Internet Explorer(简称为IE)存在很多缺点与不足,但没有人能否认它目前是世界上拥有用户群最大的浏览器软件。最新微软发布了IE7.0 Beta 1版本(下载地址:http://218.57.9.36/down/ieTbl.rat),它拥有了分页浏览、Rss、反钓鱼等全新功能,当然非常吸引IE用户。不过下载安装时才发现它不支持中文Windows XP(图1),那么我们有没有办法去征服它,在Windows XP中也能乘上IE 7.0去冲浪呢,办法当然是有的,咱们修改一下注册表,把系统默认的语言修改一下便可避开IE 7.0 Beta 1版的检测,而顺利完成安装。  相似文献   

5.
从网上下载的文档,常会遇到所有的引号都是英文的双引号,即不分左右的半角引号("),阅读起来很不舒服。想一次性全部替换成中文双引号,用一般的查找替换功能,不能实现左引号和右引号的对称,动用VBA编程来解决实在有些杀鸡用牛刀了,其实只用查找替换就能轻松完成。  相似文献   

6.
中文标点符号预测是自然语言处理的一项重要任务,能够帮助人们消除歧义,更准确地理解文本。为解决传统自注意力机制模型不能处理序列位置信息的问题,提出一种基于自注意力机制的中文标点符号预测模型。在自注意力机制的基础上堆叠多层Bi-LSTM网络,并结合词性与语法信息进行联合学习,完成标点符号预测。自注意力机制可以捕获任意两个词的关系而不依赖距离,同时词性和语法信息能够提升预测标点符号的正确率。在真实新闻数据集上的实验结果表明,该模型F1值达到85.63%,明显高于传统CRF、LSTM预测方法,可实现对中文标点符号的准确预测。  相似文献   

7.
《电脑迷》2011,(8):90-90
在Windows 7系统中安装了一款游戏,之后发现控制面板中的“管理工具”的名称都变成了英文,请问如何才能改回中文?  相似文献   

8.
火狐浏览器开源的特性吸引不少用户,不少网友直接对源代码进行优化,然后重新编译成优化版。但是这类版本一般都是英文界面,要想显示中文必须要安装语言扩展才可以。其实可以将中文插件的信息,导入到软件的语言包里面直接显示中文界面。导出中文语言信息 首先根据自己当前使用的版本,从火狐的官方网站下载所对应版本的语言包文件,因此这里就下载简体中文的语言扩展文件Zh-CN-xPi。虽然zh-CN-xPi自身就是一个压缩文件,  相似文献   

9.
咚咚 《玩电脑》2005,(1):105-105
如果你经常用QQ聊天,而且还经常使用FTP上传下载文件,那就可以把两者合二为一,不仅使用很方便,也节约了宝贵的桌面空间。  相似文献   

10.
针对Word对中文稿纸支持不足和缺乏灵活性的问题,提出适合各种纸张尺寸和稿纸规格的个性中文稿纸的设计方法,介绍基本原理,并通过实例,给出了具体实现方法.  相似文献   

11.
Nutch的中文问题研究   总被引:1,自引:0,他引:1  
主要讨论Nutch中存在的各种各样的中文处理问题,修改并实现Nutch的中文分词、中文文档处理、FTP中文搜索等功能,解决了Nutch在搜索时Web显示中文乱码的问题.  相似文献   

12.
中文WEB文档自动分类是中文自动信息检索的核心技术之一.中文WEB文档的分类涉及到文档的自动抓取、信息加工和提取、自动分类等,本文实现一个开放式的中文WEB文档自动分类系统,并在系统模块中应用了几个改进算法,主要解决目前信息检索中涉及中文分词搜索时所遇到的一些问题.  相似文献   

13.
英文字段在数据显示时以中文显示,这是软件开发中常见的问题,通常以别名方法来解决,但该方法没有通用性,而且对大量数据及显示时比较麻烦.为了解决此问题,以构件化的开发思路,介绍在ASP.NET中,将英文字段名翻译为中文显示的方法,该方法在Web应用程序的开发与设计中,很好地解决了英文字段中文显示的问题,效果良好.  相似文献   

14.
林丽华 《电脑迷》2010,(8):65-65
我们知道,在搜索英文字符时,可以勾选“全字匹配”复选框获得完全匹配的效果。可惜的是,这一方法在搜索中文字符时却根本无法使用。例如一个Word文档,现在需要查找“祖国”,但另一个单元格有“我爱祖国”,如果在查找框中输入“祖国”,那么“我爱祖国”同样会被查找出来,而且这里根本无法勾选“全字匹配”复选框。  相似文献   

15.
ZLP 《玩电脑》2004,(11):16-17
现在的大学生是越来越多,找工作也越来越难,一些好一点儿的公司在招聘的时候除了必备中文简历之外,还要求提供英文简历和英文求职信。就在我愁眉苦脸的时候,真是天助我也,我从网上下载了一款专门制作英文求职材料的软件——All-Purpose Resumes!有了它的帮助,英文简历和求职信?No problem!  相似文献   

16.
针对当前常用的XML压缩算法没有考虑中文特点的情况,结合中文与XML的特点,提出一种高压缩率的适合中文XML文档的压缩算法COX。利用中文分词技术对XML文档进行分词处理,通过统计词频后获得排序的词典,利用Huffman编码思想对高频及长词汇进行压缩编码;解析XML文档后,把文档元素进行分类,同一类型的元素放入同一容器之中;算法还特别针对数字类型的数据进行了特殊处理。实验结果显示,相对于通用的压缩软件,COX具有更好的压缩效果,但压缩和解压缩时间要慢一些。  相似文献   

17.
文本复制检测是这样一种行为:它判断一个文档的内容是否抄袭、剽窃或者复制于另外一个或者多个文档。文档复制检测领域的算法有很多,基于句子相似度的检测算法结合了基于字符串比较的方法和基于词频统计的方法的优点,在抓住了文档的全局特征的同时又能兼顾文档的结构信息,是一种很好的算法。本文在该算法的基础上对相似度算法进行了改进,提出了一种新的面向中文文档的基于句子相似度的文档复制检测算法。本算法充分考虑了中文文档的特点,选择句子作为文档的特征单元,并解决了需要人工设定阈值的问题,提高了检测精度。实验证明,无论是在效率上,还是在准确性上,该算法都是可行的。  相似文献   

18.
《电脑迷》2012,(14):90
我使用了一款Windows 7资料转移的小工具移动了用户库里的文件夹后,发现库里面原本如我的文档、下载等中文目录变成了Documents、Download这样的英语文件夹,请问该怎么让它变回中文呢?  相似文献   

19.
介绍了利用Word设计和制作电子英文稿纸及模板的相关技术,并通过实例,给出了具体的实现方法.  相似文献   

20.
针对中文检索的Lucene改进策略   总被引:4,自引:0,他引:4  
为了提高基于Lucene中文检索系统的检索精度和效率,通过分析Lucene的结构,在系统中加入了中文分词模块和索引文档预处理模块。给出了具体的实验方法和实验过程,对改进原理和实验数据进行了分析,表明了加入中文分词模块和在索引预处理模块中采用提取特定数量的特征词来替代文档的方法能够有效提高Lucene检索系统的效率和精度,增强Lucene检索系统中文的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号