排序方式: 共有57条查询结果,搜索用时 15 毫秒
11.
12.
13.
态度挖掘是近年来文本挖掘领域的热点课题之一,旨在发现文本中作者的主观态度倾向,为基于舆情的决策过程提供支持。目前已有的态度挖掘算法绝大多数都基于情感词典来识别情感词,在此基础上判别句子或文本的总体态度倾向。然而,手工构造和维护一部完善的情感词典是不现实的。对中文情感词的极性判别问题进行了研究,提出了基于直推式学习的中文情感词极性判别算法。该算法以少量情感词为种子,利用词典中词汇的解释信息,直推出其他词的情感极性。与使用相同情感种子词的解释信息作为训练数据的有监督学习算法相比,直推式学习算法的识别精度提高了20%左右。 相似文献
14.
针灸是中医的重要组成部分,运用新兴技术挖掘大量隐藏在针灸诊疗记录中的规律,既可推动针灸更好地为国民健康服务,又能促进中医现代理论体系的完善。腧穴(即穴位)的选择是针灸治病的关键,而运用现代技术选择腧穴的研究还处于起步阶段。以数据挖掘技术为手段,提出了一种基于K近邻方法的腧穴处方自动生成算法。该算法通过分析病历库中与目标现病史最相似K条病历的穴位配方,来自动给出患者针灸治疗的推荐方案。为更好地计算病历的相似性,根据针灸临床数据的特点分别采用了规范症状、一元字串(unigram)和二元字串(bigram)三种特征。在包含6 267条针灸临床病历的数据集上对算法的有效性进行了验证,实验结果表明使用一元字串和二元字串的特征更适合腧穴处方的自动生成,在删除或保留患者复诊数据这两种情况下F度量值分别可达到40.30%和62.71%。 相似文献
15.
16.
18.
19.
20.
基于感知器的生物医学命名实体边界识别算法 总被引:1,自引:0,他引:1
在生物信息学领域内生物医学命名实体识别(Bio-NER)是生物医学文献挖掘、利用的基础工作,由于实体边界识别的困难导致目前Bio-NER效率较低,因此提出了基于感知器的实体边界识别算法,该算法采用随机梯度下降算法训练权重,利用token过滤器、n-gram模型及实体过滤器实现生物医学命名实体边界识别。在GENIA corpus 3.02语料库上进行的实验表明,该算法可以达到71.5%的准确率和79.2%的召回率,与相关工作相比均有一定提高。另外算法相对简单,识别算法速度较快,易在生产中应用。 相似文献