排序方式: 共有102条查询结果,搜索用时 15 毫秒
1.
实体抽取是自然语言处理中的一项基础任务,基于实体抽取的医疗领域实体分类是医疗知识图谱构建的基础,现有的实体抽取方法鲜有基于字符级的特征.文中提出了KBLCC方法,一种融合实体关键字特征的医疗领域实体分类方法.通过对医疗领域文本的语言特点进行分析与总结,发现医疗领域实体通常包含一些明显的关键字特征,能够辅助实体分类任务.融合实体关键字特征构建了BERT-BILSTM-CNN-CRF混合模型对医疗领域实体进行抽取,并将医疗实体分为检验指标、疾病、症状这三大类.实验结果表明,使用KBLCC模型进行医疗领域实体分类能够提高实验效果,准确率、召回率和F1值分别达到89.38%、92.46%和90.89%. 相似文献
2.
提出了动态邻接封闭区间连接方法以及基于球面特征的检索方法。依据模型封闭区间的位置关系以及所占比重对原模型的多个封闭区间进行连接,将原模型合并成一个封闭区间,计算模型各点的m值,即测地线距离函数值,分裂区间,聚合成骨架点,去除冗余点得到连通的骨架;以m值最小的骨架点为球心,在骨架上建立 N个球面,提取球面相交的特征用于检索。实验结果表明,本文算法能有效提取多封闭区间三维模型骨架,提高三维模型的查准率。 相似文献
3.
采用支持向量机(SVM)方法实现搜索引擎日志中"N+V+N"、"V+N+N"型短语功能类别识别。通过选取不同特征,构建多特征模板,实现对"N+V+N"、"V+N+N"型短语中名词短语、动词短语、主谓短语三种功能短语的自动识别,并且针对不同词性标注集对实验结果是否有影响进行了实验。实验结果显示,SVM在搜索引擎日志短语识别中有很高的识别率。 相似文献
4.
5.
6.
7.
目的:为提高复杂背景下的视频字幕在OCR中的识别率,需要对提取的视频字幕进行有效地字幕增强。该文首次将Logistic模型应用到视频字幕增强中,提出了基于Logistic模型的融合多帧信息的视频字幕增强方法。方法:对字幕进行检测与跟踪,将出现在连续多帧中的同一字幕片段进行对齐;通过分析字幕片段在多帧中信息,提出字幕背景在时域上的变化特征、背景和字幕文本的固有特征,并将三个特征进行量化与融合,构建适用于字幕增强的Logistic模型,实现对视频字幕的增强。结果:对含阴影或描边效果的特殊复杂背景字幕、普通复杂背景字幕、单一背景字幕分别进行实验,增强后的字幕在OCR软件中的识别正确率分别为81.76%、97.13%、98.19%,与对比方法比较均有一定的提高。结论:实验结果表明,该文方法既可以降低字幕背景的复杂度,又可以提高字幕背景与文本的对比度,从而可以对复杂背景和单一背景下的视频字幕进行有效地增强。 相似文献
8.
9.
基于内容的机械设计图像检索目前尚无针对性的研究,提出利用形状特征作为图像检索的标准,根据机械设计图像的特点,对3种不同的形状特征描述子的检索性能进行研究,分别提取图像库中各个图像的傅里叶描述子、Hu不变矩和距离分布直方图特征,并分组进行图像检索实验。实验结果表明:机械设计图的标引对其形状特征的描述有较大的影响,基于轮廓的形状特征描述法在检索中有最高的查准率。 相似文献
10.
基于实例的机器翻译系统需要双语句对的支持。为大量获取双语句对,则需要以篇章对齐的双语文本为输入,实现句子的自动对齐。通过分析汉英双语法律文本的特征,提出了法律文本对齐假设。首先识别出法规源文和译文中的结构标识和句子,然后在句子一级对齐法律文本。该方法在150篇汉英法律文本语料上,取得了80.98%的对齐准确率。 相似文献