期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

夏云庆黄锦辉张普《中文信息学报》2007,21(3):83-91

随着互联网走入社会生活,网络聊天逐渐成为一种新的沟通渠道,网络聊天语言便应运而生。这类语言的日益丰富,给语言信息处理带来了新的挑战。研究发现,困难主要来自网络聊天语言的奇异性和动态性。本文借助真实网络聊天语言文本,对网络聊天语言的奇异性和动态性进行详细分析和归纳,并设计了面向解决奇异性和动态性问题的网络聊天语言文本识别与转换方法。我们先以网络聊天语言语料库为基础建立网络聊天语言模型和语言转换模型,通过信源–信道模型实现网络聊天语言向标准语言的转换。但该方法过于依赖网络聊天语言语料库,虽然能较好解决奇异性问题,但不能处理动态性问题。因此,我们进而以标准汉语语料库为基础建立文字语音映射模型,对信源–信道模型进行改进,最终有效解决了网络聊天语言的动态性问题。相似文献

2.

基于词义类簇的文本聚类

唐国瑜夏云庆张民郑方《中文信息学报》2013,27(3):113-120

文档表示是文本聚类的重要组成部分,该文旨在通过改进文档表示改进文本聚类。同义词和多义词现象是文档表示所面临的重要挑战。为此该文提出了词义类簇模型(Sense Cluster Model,SCM),在词义类簇空间上表示文档。SCM首先构造词义类簇空间,然后将文档表示在词义类簇空间上,获得每篇文档在每个词义类簇的概率。在词义类簇空间构造这一步骤中,首先利用词义归纳技术从文本中自动发现词义,接着采用词义聚类技术识别相同或者相似的词义从而获得词义类簇。词义类簇空间构造后,该文首先进行词义消歧,然后利用词义消歧的结果将文档表示在词义空间上。实验表明,SCM在标准测试集上的性能优于基线系统以及经典话题模型LDA。相似文献

3.

交互式译系统IHSMTS的多策略翻译引擎

晋薇夏云庆等《计算机工程》2002,28(7):58-60,177

IHSMTS采用了多策略的翻译方式，融合了RBMT，EBMT和机助人译等思想，提高了自动构造文的质量，并实现了良好的经验记忆和知识自动获取，同时，采用智能人的机交互技术，构建了一个机组翻译平台，文章介绍了IHSMTS的翻译处理原理和系统关键技术的实现方法。相似文献

4.

交互式机译系统IHSMTS的多策略翻译引擎

晋薇夏云庆王建德《计算机工程》2002,28(7):58-60

采用了多策略的翻译方式,融合了,和机助人译等思想,提高了自动构造译文的质量,并实现了良好的经验记IHSMTSRBMTEBMT忆和知识自动获取。同时,采用智能的人机交互技术,构建了一个机助翻译平台。文章介绍了的翻译处理原理和系统关键技术的实IHSMTS现方法。相似文献

5.

IHSMT中的实例优化策略 总被引：1，自引：0，他引：1

王建德陈肇雄黄河燕夏云庆《计算机研究与发展》2002,39(3):313-317

在基于实例的机器翻译方法中，通常采用双语句子实例的形式，但由于自然语言表达的无限多样性，使得这种存储粒度过大的句子级翻译实例的利用率较低；而在基于规则的机器翻译方法中，规则和词典具有一定的抽象性，其重复利用率高，但其中存在大量的歧义，提出了一种IHSMT中的实例自动优化算法，该算法引入了实例粒度的概念，根据规则和实例使用率，将粒度大的实例分解为较小的单元，并建立相应的词典，以提高实例的使用频率和检索效率，同时在翻译过程中，根据用户修改的统计和上下文信息，对粒度小并且有歧义的实例进行合并，以提高翻译质量和推理效率，从而使实例粒度更加合理，存储结构更优化，系统的效率更高。相似文献

6.

多策略机器翻译系统IHSMTS中模式库的设计 总被引：1，自引：0，他引：1

晋薇夏云庆王建德《微型电脑应用》2002,18(3):5-9

本文介绍了语料库研究的一些特点，并以交互式多策略的思想为背景，对IHSMTS系统CBMT翻译引擎中模式库的设计思想，并对模式的表示，模式库的组织进行了阐述，方便了模式库检索，添加等操作的实现。同时介绍了近似模式匹配算法，从句法功能相似的角度抽取出所比较事例的功能词和句法特征，作为检索模式库和相似度计算的依据。最后介绍了模式库知识获取和知识精练的过程。相似文献

7.

中文信息检索系统的模糊匹配算法研究和实现 总被引：3，自引：0，他引：3

王静帆邬晓钧夏云庆郑方《中文信息学报》2007,21(6):59-64

在现代中文信息检索系统中,用户输入的字符串和实际数据库中的条目往往存在局部偏差,而基于关键词匹配的检索技术不能很好地解决这一问题。本文参考并改进了Tarhio和Ukkonen提出的过滤算法^[1],针对汉字拼音输入法中常出现的同音字/近音字混用现象,将算法进一步扩展到广义的Edit Distance上。实验表明,本文提出的算法能有效提高中文信息检索系统的召回率,在实际应用中可达到“子线性”的效率。相似文献

8.

VisualC++4.0的面向对象性能分析及应用

夏云庆张秉权《电脑开发与应用》1998,11(4):14-17

在众多的面向对象编程语言中，ＭｉｃｒｏｓｏｆｔＶｉｓｕａｌＣ＋＋４．０以其卓越的面向对象性能和丰富的面向对象编程工具，以不可阻挡的趋势走在软件开发领域的前列。本文在实践的基础上，对ＶｉｓｕａｌＣ＋＋４．０的面向对象性能作了浅显的分析，并将这一性能的应用加以介绍。相似文献

9.

基于跨语言广义向量空间模型的跨语言文档聚类方法

唐国瑜夏云庆张民郑方《中文信息学报》2012,26(2):116-121

跨语言文档聚类主要是将跨语言文档按照内容或者话题组织为不同的类簇。该文通过采用跨语言词相似度计算将单语广义向量空间模型(Generalized Vector Space Model, GVSM)拓展到跨语言文档表示中,即跨语言广义空间向量模型(Cross-Lingual Generalized Vector Space Model,CLGVSM),并且比较了不同相似度在文档聚类下的性能。同时提出了适用于GVSM的特征选择算法。实验证明,采用SOCPMI词汇相似度度量算法构造GVSM时,跨语言文档聚类的性能优于LSA。相似文献

10.

微博文本处理研究综述 总被引：2，自引：0，他引：2

张剑峰夏云庆姚建民《中文信息学报》2012,26(4):21-28

微博是一个基于关系的信息分享、传播以及获取平台。用户可以通过WEB、WAP以及各种客户端组件,以140字左右的文字更新信息,并实现即时分享。由于微博发展迅猛,微博文本已经形成了大规模积累,针对微博文本的研究已经成为了一个十分重要的课题。该文对微博文本进行了定义,阐述了微博文本研究的重要性,并从微博文本的不同应用领域出发,对微博文本的研究现状进行了综述,介绍了目前已经存在的微博文本数据集和应用系统。相似文献