排序方式: 共有18条查询结果,搜索用时 15 毫秒
1.
分词和词性标注是中文处理中的一项基本步骤,其性能的好坏很大程度上影响了中文处理的效果。传统上人们使用基于词典的机械分词法,但是,在文本校对处理中的文本错误会恶化这种方法的结果,使之后的查错和纠错就建立在一个不正确的基础上。文中试探着寻找一种适用于文本校对处理的分词和词性标注算法。提出了全切分和一体化标注的思想。试验证明,该算法除了具有较高的正确率和召回率之外,还能够很好地抑制文本错误给分词和词性标注带来的影响。 相似文献
2.
本文阐述了中文文本信息的特征,并在此基础上提出了利用文本信息的统计特征规律和评议结构特征规律进行中文文本校对的方法及其实现的算法。 相似文献
3.
4.
正在上述操作中,我们将文本转换为语音以节约时间,不过在实际使用中,对于一些重要的数据,我们在听音频时需要打开文本确认,而在进行文本校对的时候,我们则希望听听音频进行校对。怎么在文本和音频之间快速切换?大家在使用听歌软件的时候,会发现歌词可以同步显示在屏幕上。因此要实现文本和语音的转换,我们只要将文本转换为音频对应的"歌词"即可实现。因为语音转换软件在转换时遇到句号会有一个停顿,可先将转 相似文献
5.
用于文本校对的分词与词性标注一体化算法 总被引:1,自引:0,他引:1
分词和词性标注是中文处理中的一项基本步骤,其性能的好坏很大程度上影响了中文处理的效果.传统上人们使用基于词典的机械分词法,但是,在文本校对处理中的文本错误会恶化这种方法的结果,使之后的查错和纠错就建立在一个不正确的基础上.文中试探着寻找一种适用于文本校对处理的分词和词性标注算法.提出了全切分和一体化标注的思想.试验证明,该算法除了具有较高的正确率和召回率之外,还能够很好地抑制文本错误给分词和词性标注带来的影响. 相似文献
6.
提出了一种新的相似字符串查询的方法。其目的在于提高基于相似字符串匹配的查询在大规模字符串数据库中的查询效率,并且提供带通配符的字符串查询方式。该方法使用Trie数据结构组织数据库中的数据,使用基于编辑距离的相似字符串匹配方法,在Trie数据结构中进行高效的匹配和查询,得到K相似度下的候选词集。实验证明,本方法在K≤2时具有相当高的查询效率。 相似文献
7.
随着信息技术的快速发展,互联网越来越朝着智能化的脚步靠近,在人机交互过程中开始越来越多的使用自然语言。那么对于输入自然语言进行校对的研究便日益变成一个非常紧迫的课题。为了能够对中文输入校对有着更加深入的认知与了解,该文对文本校对的语言模型,策略方法,设计思路给与了简单的分析研究,并设计了一个简单的文本校对系统,实现中文语句的文本校对,用于在自动问答系统和用户搜索问句的相关领域进行纠错,为用户提供更好的服务。 相似文献
8.
中文自动校对的原理与实现 总被引:1,自引:0,他引:1
本文简要介绍了中文自动校对的主要原理和基本算法,讨论了校对软件系统现有工作方式及校对流程。 相似文献
9.
针对中文文本校对技术中存在的校对准确率较低的问题,提出了一种基于字典树模型的专业课查询文本校对方法.首先,通过计算错误文本与匹配文本间的编辑距离对错误关键词进行模糊匹配; 其次,采用字典树语言模型建立搜索树,以提高查询效率.最后,通过对比不同文本相似度阈值下的校对效果选取最佳文本相似度阈值.在最佳阈值下(0.5),将本文模型与传统的拼音模型和N -gram模型进行问句校对对比显示,本文方法的准确率(77.91%)、召回率(67%)、F值(72.04%)比传统的拼音模型校正方法分别提高了5.69%、23.67% 和11.57%,比N -gram模型校正方法分别提高了0.64%、10.33%和7.89%.因此,本文提出的方法在专业课查询文本校对方面具有很好的应用价值. 相似文献
10.
针对中文文本在语法错误和语义错误校对方面存在的问题,基于HNC理论构建了一个中文文本校对系统模型,该模型利用传统查错系统和HNC句类分析系统相结合的方法,并对日常报刊杂志100篇文章进行了实验,与word2003查错系统相比,在解决语法层次和语义层次上的错误,该方法有明显优势. 相似文献