彝文网页敏感信息监测系统的研究 |
| |
引用本文: | 林春,王嘉梅,张建营,樊津瑜.彝文网页敏感信息监测系统的研究[J].中国新通信,2013(24):41-42. |
| |
作者姓名: | 林春 王嘉梅 张建营 樊津瑜 |
| |
作者单位: | 云南民族大学 电气信息工程学院 |
| |
基金项目: | 国家自然科学基金“云南跨境民族网络舆情信息挖掘关键技术研究”(项目批准号61363085)项目;云南省重大项目“云南跨境民族语言网络敏感信息传播与分析一以彝文为例”项目;云南民族大学创新团队;云南省云南民族大学少数民族语言信息化处理研究中心资助. |
| |
摘 要: | 为解决互联网上彝文内容安全的问题,提出了一种互联网彝文内容安全检测过滤系统。通过对彝文字词组合形式和基本特点的深入研究,主要包括彝文的预处理、彝文字词的分解、词条的的字典排序、字词的频度统计等。本文还对安全检测过滤系统的框架进行了描述,并针对彝文编码、彝文分词方法等问题进行了讨论,提出了彝文编码的判定转换方法以及格语法与词典相结合的彝文分词方法。
|
关 键 词: | 彝文内容安全彝文分词模式匹配文本分类 |
本文献已被 维普 等数据库收录! |
|