排序方式: 共有237条查询结果,搜索用时 46 毫秒
1.
针对传统的主题爬虫对网页信息缺乏在知识层面上的处理和理解的问题进行了研究,提出了一种面向增量同生主题的维吾尔文爬虫,通过建立一个增量主题词库优化传统的主题模型,来描述维吾尔文关键词的应用语境及场景,提高了计算网页相关度的准确率。用改进的IC主题敏感算法来预测子页面优先级,过滤无关的网页地址。依据上述方法编写爬虫系统,用构建的维吾尔文语料库进行实验,表明了基于此模型的爬虫具有更好的稳定性和准确度。 相似文献
2.
MM云开发平台是移动公司推出的手机应用制作平台,利用这个平台可以方便快捷地开发出很多手机应用程序.《基础维语》作为新疆大学生的一门选修课,被许多同学所喜欢,利用MM云开发平台的音乐制作模版,可以开发出很优秀《基础维语》移动学习app,经初步应用,取得很好的效果. 相似文献
3.
维吾尔文多模式匹配算法是影响维吾尔文关键词过滤和检测性能的关键步骤之一.为此,考虑维吾尔文语法特点、书写方式、字母变换形式、特殊字母等因素,提出一种基于维吾尔文音节划分的多模式匹配算法.通过Bohum-sani函数的维吾尔语音节分解方法计算字符串音节数,利用Bohum-xekli函数得到字符串音节结构,按语法特点从右至左方式进行模式比较,实现维吾尔文多模式匹配.实验结果表明,与现有模式匹配算法相比,该算法具有更高的匹配效率. 相似文献
4.
基于N元模型的维吾尔文文本分类技术研究 总被引:1,自引:0,他引:1
考虑到维吾尔文词干提取、词性标注等工具不够成熟和相关的开源资源很少的实际情况,提出了基于N元模型的维吾尔文文本分类技术.其特点是不需要任何自然语言处理工具,拼写错误率对分类结果的影响很低.在训练阶段分别提取字符级别的三元和四元模型构造不同规模的N元词典,在分类测试阶段分别用曼哈顿距离计算和骰子测量对文本进行分类.实验结果表明,当四元模型词典的规模为500时,使用骰子测量分类时性能最佳,平准准确率达到86.56%. 相似文献
5.
6.
7.
8.
维吾尔语词首音节元音声学分析 总被引:1,自引:0,他引:1
该文利用“维吾尔语语音声学参数数据库”,统计分析和归纳了维吾尔语词首音节元音的共振峰模式及其分布格局。声学元音图有多种画法,该文采用JOOS型声学元音图。这种元音图的特点是以F1为纵坐标,以F2为横坐标。这样绘制成的声学元音图与元音舌位图有很好的对应性。维语标准音词首音节中有[y, i, e, O, u, o, ;, A]等8个元音。舌位前后的分布特点是[u, o, A]为后元音,[y, i, e, O, ;]为前元音;开口度(舌位高低)分布特点是[y, i, u]为高元音,[e, O, o]为次高元音,[;]为次低元音, [A]为低元音. 相似文献
9.
该文通过研究国内外相关的句法分析算法与理论,再结合维吾尔语自身的特点对基于规则的维吾尔语句法分析方法进行讨论,由于维吾尔语作为一种自然语言,具有自然语言所共有的一些规则,发现国外经典的句法分析方法同样适合于维吾尔语的句法分析,本论文主要讨论了自项向下的的自动句法分析方法。 相似文献
10.