排序方式: 共有237条查询结果,搜索用时 109 毫秒
1.
根据维吾尔语词重音的位置规律进行音节级标注,提取不同的特征参数(能量、基频等),对各个特征参数作单流、分流及特征级融合识别实验,对比分析各特征参数对重音检测识别率的影响。对融合后的高维单流特征采用主成分分析作降维、去冗余处理,并作识别实验。参照识别精确率结合语音语言学知识对实验结果进行分析。 相似文献
2.
针对传统的主题爬虫对网页信息缺乏在知识层面上的处理和理解的问题进行了研究,提出了一种面向增量同生主题的维吾尔文爬虫,通过建立一个增量主题词库优化传统的主题模型,来描述维吾尔文关键词的应用语境及场景,提高了计算网页相关度的准确率。用改进的IC主题敏感算法来预测子页面优先级,过滤无关的网页地址。依据上述方法编写爬虫系统,用构建的维吾尔文语料库进行实验,表明了基于此模型的爬虫具有更好的稳定性和准确度。 相似文献
3.
MM云开发平台是移动公司推出的手机应用制作平台,利用这个平台可以方便快捷地开发出很多手机应用程序.《基础维语》作为新疆大学生的一门选修课,被许多同学所喜欢,利用MM云开发平台的音乐制作模版,可以开发出很优秀《基础维语》移动学习app,经初步应用,取得很好的效果. 相似文献
4.
维吾尔文多模式匹配算法是影响维吾尔文关键词过滤和检测性能的关键步骤之一.为此,考虑维吾尔文语法特点、书写方式、字母变换形式、特殊字母等因素,提出一种基于维吾尔文音节划分的多模式匹配算法.通过Bohum-sani函数的维吾尔语音节分解方法计算字符串音节数,利用Bohum-xekli函数得到字符串音节结构,按语法特点从右至左方式进行模式比较,实现维吾尔文多模式匹配.实验结果表明,与现有模式匹配算法相比,该算法具有更高的匹配效率. 相似文献
5.
基于N元模型的维吾尔文文本分类技术研究 总被引:1,自引:0,他引:1
考虑到维吾尔文词干提取、词性标注等工具不够成熟和相关的开源资源很少的实际情况,提出了基于N元模型的维吾尔文文本分类技术.其特点是不需要任何自然语言处理工具,拼写错误率对分类结果的影响很低.在训练阶段分别提取字符级别的三元和四元模型构造不同规模的N元词典,在分类测试阶段分别用曼哈顿距离计算和骰子测量对文本进行分类.实验结果表明,当四元模型词典的规模为500时,使用骰子测量分类时性能最佳,平准准确率达到86.56%. 相似文献
6.
多词领域术语抽取是自然语言处理技术中的一个重点和难点问题, 结合维吾尔语语言特征,该文提出了一种基于规则和统计相结合的维吾尔语多词领域术语的自动抽取方法。该方法分为四个阶段: ①语料预处理, 包括停用词过滤和词性标注; ② 对字串取N元子串, 利用改进的互信息算法和对数似然比率计算子串内部的联合强度, 结合词性构成规则, 构建候选维吾尔语多词领域术语集; ③ 利用相对词频差值, 得到尽可能多的维吾尔语多词领域术语; ④ 结合C_value值获取最终领域术语并作后处理。实验结果准确率为85.08%, 召回率为 73.19%, 验证了该文提出的方法在维吾尔语多词领域术语抽取上的有效性。 相似文献
7.
8.
维吾尔语框架语义知识库的概念设计 总被引:1,自引:1,他引:0
该文对维吾尔语的框架语义描述体系及内容进行了初步探讨和尝试,建立了维吾尔语框架语义文档的树型结构。根据维吾尔语框架语义知识库的描述内容及框架语义网络自身的特点,该文在数据库中以维吾尔语框架语义为核心进行信息存储,设计了语义知识库的概念模型。为创建基于认知的维吾尔语框架语义知识库建设探索了一条可行的技术路线、方法和思路。 相似文献
9.
10.