排序方式: 共有91条查询结果,搜索用时 0 毫秒
41.
42.
基于Lucene实现了一个海量数据库全文检索的原型。把关系数据库引入了本系统,可针对不同类型的源数据库灵活配置,比采用配置文件更加灵活;采用多线程,通过动态机制来实现不同类型源数据库中记录的抽取、转换、建立索引;提供定时自动更新索引的功能;提供多种检索方式。 相似文献
43.
基于医疗类别的电子病历命名实体识别研究 总被引:2,自引:2,他引:0
基于电子病历命名实体识别对智慧医疗和医疗知识图谱的构建具有重要意义,提出一种基于医疗类别的命名实体识别方法。首先,针对电子病历语料中实体特点进行深度挖掘,将电子病历分为4类医疗类别;然后,对各医疗类别分别构建特征集,并使用条件随机场模型对身体部位、症状和体征、检查与检验、疾病与诊断、治疗等5类命名实体进行命名实体识别;最后,将基于医疗类别特征集识别效果和通用特征集的识别结果进行对比。实验结果表明,基于医疗类别的电子病历命名实体识别效果显著提升,可以满足应用需求。 相似文献
44.
针对传统人工鱼群算法的寻优精度不高、后期收敛速度慢且出现振荡现象的问题,提出一种自适应视野和步长的人工鱼群算法,该算法将两条人工鱼之间的距离作为视野,并将得到的视野乘以一个系数作为步长。随着鱼群的不断聚集,视野和步长相应地减小,有利于搜寻到最优点。实验结果表明,改进后的算法收敛速度更好、寻优精度更高。 相似文献
45.
针对中文微博中的海量文本,提出了利用领域观点词词典和支持向量机的方法对中文微博中的观点句进行识别.构建领域观点词词典,统计了表示中文微博观点句的5个特征,选取特征1,2,3,4进行观点句识别,并将基于支持向量机的3种不同特征组合识别算法与基于领域观点词词典的识别算法进行对比.算法对比结果表明,基于支持向量机的算法对微博观点句的识别效果较好,准确率68.75%,召回率48.71%,F值57.02%. 相似文献
46.
48.
随着大型烘焙企业纷纷建立连锁经营网络,推行会员制,信息系统普及,企业拥有的会员销费记录逐步达到海量,如何将这些数据充分利用,挖掘出高价值信息。本文通过针对实际业务需求,基于SQLServer2008探讨了数据挖掘技术在烘焙零售企业的客户关系管理系统的应用。 相似文献
49.
50.
为了解决在抽取过程中出现的关系三元组重叠问题,提出了一种基于位置辅助标记的实体关系联合抽取模型,使用BERT作为预训练语言模型,并且通过位置辅助矩阵方法,将关系三元组抽取转换成实体和关系的匹配问题,实现实体和关系的联合抽取,在中文数据集DuIE上进行了相关实验。实验结果表明,该模型抽取效果较好,提出的基于位置的辅助标记方法有效解决了关系重叠问题。 相似文献