首页 | 本学科首页   官方微博 | 高级检索  
     

中医诊断古文的词性标注与特征重组
引用本文:王国龙,杜建强,郝竹林,程春雷,蔡良俊,张鑫. 中医诊断古文的词性标注与特征重组[J]. 计算机工程与设计, 2015, 0(3): 835-841
作者姓名:王国龙  杜建强  郝竹林  程春雷  蔡良俊  张鑫
作者单位:1. 江西中医药大学计算机学院,江西南昌,330004
2. 江西中医药大学临床医学院,江西南昌,330004
基金项目:国家973重点基础研究发展计划基金项目(2010CB530602);国家自然科学基金项目(61363042);江西中医药大学校级研究生创新专项基金项目(JZYC12C04);江西省研究生创新基金项目(YC2013-S226)
摘    要:中医诊断古文存在大量单音词,使用通用切词技术处理,结果是单个的分词结果,不能构成一个完整的诊断词汇。对此,设计一个基于键值对模型的中医诊断词性标记集,提出基于词汇联系的隐马尔可夫模型(HMM ),进行词性标注,结合词法分析,采用移进归约算法进行特征重组,生成中医诊断词汇。实验结果表明,改进的 HMM 的词性标注准确率在训练集和测试集中分别提高了2?58%和1?02%,特征重组结果是完整独立的诊断词汇,方便中医人员进行诊断分析,适合构成向量空间模型的特征。

关 键 词:中医诊断古文  键值对模型  隐马尔可夫模型  词性标注  特征重组

POS tagging and feature recombination for ancient prose of TCM diagnosis
WANG Guo-long , DU Jian-qiang , HAO Zhu-lin , CHENG Chun-lei , CAI Liang-jun , ZHANG Xin. POS tagging and feature recombination for ancient prose of TCM diagnosis[J]. Computer Engineering and Design, 2015, 0(3): 835-841
Authors:WANG Guo-long    DU Jian-qiang    HAO Zhu-lin    CHENG Chun-lei    CAI Liang-jun    ZHANG Xin
Affiliation:WANG Guo-long;DU Jian-qiang;HAO Zhu-lin;CHENG Chun-lei;CAI Liang-jun;ZHANG Xin;School of Computer Science,Jiangxi University of Traditional Chinese Medicine;School of Clinical Medicine,Jiangxi University of Traditional Chinese Medicine;
Abstract:
Keywords:ancient prose of TCM diagnosis  key-value pairs model  hidden Markov model  part-of-speech tagging  feature recombination
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号