排序方式: 共有56条查询结果,搜索用时 15 毫秒
41.
针对基于数字键盘的语句级拼音汉字输入技术,提出了键音转换问题,并给出了解决方案.首先,形式化地定义了键音转换问题,并根据Bayes原理推导出两种键音转换处理模型.然后将键音转换问题转化为有向无环图的路径搜索问题,根据两种处理模型,分别描述了搜索空间并定义了搜索算法.实验结果表明提出的算法能够有效地解决该问题. 相似文献
42.
文本匹配是自然语言理解的关键技术之一, 其任务是判断两段文本的相似程度. 近年来随着预训练模型的发展, 基于预训练语言模型的文本匹配技术得到了广泛的应用. 然而, 这类文本匹配模型仍然面临着在某一特定领域泛化能力不佳、语义匹配时鲁棒性较弱这两个挑战. 为此, 本文提出了基于低频词的增量预训练及对抗训练方法来提高文本匹配模型的效果. 本文通过针对领域内低频词的增量预训练, 帮助模型向目标领域迁移, 增强模型的泛化能力; 同时本文尝试多种针对低频词的对抗训练方法, 提升模型对词级别扰动的适应能力, 提高模型的鲁棒性. 本文在LCQMC数据集和房产领域文本匹配数据集上的实验结果表明, 增量预训练、对抗训练以及这两种方式的结合使用均可明显改善文本匹配结果. 相似文献
43.
44.
针对无线射频识别(Radio Frequency Identification,RFID)系统在识别标签的过程中出现标签碰撞识别效率不高的问题,在传统的自适应多叉树的基础上,提出了一种新型的自适应多叉树(NAMS)的防碰撞算法,该算法在计算碰撞因子选择叉数之前先估算碰撞标签数目N和统计碰撞位数m,直接识别满足N=2m的关系的叶子节点,节省了部分叶子节点的搜索时间;同时引入自动休眠计数机制,平均节省了一半的执行命令数,从而缩短了通信时间.最后对NAMS算法所需总时隙进行理论分析并将该算法用于实验,结果表明,NAMS算法较AMS算法在识别速度和系统吞吐率方面有较大提高. 相似文献
45.
46.
一种基于SVM/RS的中文机构名称自动识别方法 总被引:4,自引:0,他引:4
该文提出一种支持向量机(Support Vector Machines,SVM)和粗糙集(Rough Set, RS)相结合的中文机构名称短语识别方法。该方法借助词的基本语义搭配关系表示短语的构成规则,并通过粗糙集属性约简的方法自动学习到机构名称构成规则的无冗余集。识别时,首先寻找到与这些规则匹配的词串作为候选机构名,然后结合候选机构名以及其上下文词的语义特征,利用SVM分类器判断该候选是否是真正的机构名称。这种方法对1617万字人民日报语料开放测试的F值分别达到82.06%。 相似文献
47.
基于“编码—解码”结构的端到端生成式对话模型所生成的回复多样性差、信息量少,这在很大程度上阻碍了对话的进一步扩展和深入。而知识图谱作为一种高度结构化的知识,能够为对话提供相关知识以及话题转移关系,可以用来提升对话质量。因此,该文提出了一种基于知识拷贝机制的生成式对话模型,首先使用基于知识图谱的映射机制对对话内容进行处理,随后使用知识拷贝机制直接将知识图谱中的知识引入到生成的回复中,并使用注意力机制选择知识图谱中的信息来指导回复的生成。在“2019语言与智能技术竞赛”中的“知识驱动对话”数据集上,相较竞赛举办方提供的生成式基线模型,该文所提出模型生成的回复在字符级别的F1和多样性指标DISTINCT-1上分别有10.47%和4.6%的提升。 相似文献
48.
提出了一种基于信息熵的层次词聚类算法,并将该算法产生的词簇作为特征应用到中文组块分析模型中.词聚类算法基于信息熵的理论,利用中文组块语料库中的词及其组块标记作为基本信息,采用二元层次聚类的方法形成具有一定句法功能的词簇.在聚类过程中,设计了优化算法节省聚类时间.用词簇特征代替传统的词性特征应用到组块分析模型中,并引入名实体和仿词识别模块,在此基础上构建了基于最大熵马尔科夫模型的中文组块分析系统.实验表明,本文的算法提升了聚类效率,产生的词簇特征有效地改进了中文组块分析系统的性能. 相似文献
49.
为了在面向旅游领域的文本分类系统中选择有效的分类特征,提高分类性能,本文根据系统采用的训练集、训练过程及分类算法等因素重新对各常用的特征选择方法进行了综合实验评测,比较了五种常用的特征选择方法,对于评测结果最好的三种函数:期望交叉熵、信息增益和互信息,通过理论分析和科学实验,分别提出了不同的改进方法.实验结果表明改进的期望交叉熵方法在本应用中能够最有效地提高系统的分类性能. 相似文献
50.