共查询到19条相似文献,搜索用时 78 毫秒
1.
提出一种基于词典特征优化和依存关系的时间表达式识别方法。首先针对中文文本时间表达式边界定位不准确及长距离依赖的问题,优化了传统时间词典特征,将时间词典分为时间词词典和时间单位词典;其次针对传统基于机器学习的时间表达式识别方法忽视时间表达式本身结构特点的问题,在优化后的词典特征的基础上提取依存特征,挖掘时间表达式的结构信息;最后综合时间表达式的基本特征、词典特征和依存特征,在条件随机场模型上完成时间表达式识别。在中文语料上进行实验,时间表达式识别达到较好效果。 相似文献
2.
中文文本时间信息获取及语义计算 总被引:2,自引:0,他引:2
为了解决中文文本中时间信息的形式表达、抽取及时间语义计算等一系列问题,提出了一种可以适用于多种自然语言处理任务的时间信息处理系统,通过对汉语句子时间要素的分析以及时间词语构成形式的研究,采用一种时间表达式的概念,将承载时间信息的短语按照功能的不同分解成若干容易识别,语义单一的“小”的成分,并在此基础上给出基于规则的时间信息抽取、理解及时间语义的计算方法. 相似文献
3.
《青岛科技大学学报(自然科学版)》2017,(Z1)
车牌识别数据是一种城市道路行驶车辆的实时监测数据,具有数据量大且持续生成、时间空间相关等特性。针对当前基于车牌识别数据进行智能交通的相关研究较少,本研究利用车牌识别数据进行旅行时间可靠性的研究,首先进行旅行时间数据的获取及处理,然后利用处理后的数据,选取缓冲指数作为旅行时间可靠性主要评价指标,标准差与拥挤频率为辅助指标,对青岛市某路段车辆的旅行时间可靠性进行评价分析,证明了方法的有效性。 相似文献
4.
刘杰 《佳木斯工学院学报》2009,(4):520-522
提出了一种在构造内部规则和外部规则的同时采用概率统计的中文地名实体的识别方法,并利用这种基于规则和统计相结合的方法对测试语料库进行识别测试.实验证明该方法获得了较高的准确率和召回率,具有可行性和合理性,同时也指出了它的局限性. 相似文献
5.
地铁工程施工安全风险辨识不细致全面、风险控制措施不到位是造成安全事故的原因之一。如何将专家经验和规范中的风险识别知识结构化,通过计算机自动识别风险是应对目前缺乏有经验的风险识别技术人员的良策。而风险识别规则的获取、表示、应用是实现上述目标的关键技术。本文提出地铁工程施工风险识别规则的定义,给出获取风险事件及致险因素构成的步骤,建立致险因素权重、致险因素取值可信度的计算方法,设计了风险识别规则扩展产生式表示、结构化存储的方法,并以武汉地铁二号线螃蟹甲车站工程施工安全风险识别为例,给出了风险识别规则的具体应用。通过总结风险识别规则的内在规律和信息化处理方法,为高效自动识别地铁工程施工安全风险提供技术支撑。 相似文献
6.
针对旅游领域,提出了一种基于隐马尔可夫模型(HMM)的旅游景点实体识别方法。该方法采用HMM学习算法,选取句子各态顺序遍历模型,结合词性特征和校正规则实现了旅游景点的自动识别。最后进行了旅游景点实体识别测试实验,结果表明所提方法取得了较好的效果。其中,开放测试识别准确率、召回率、F值分别达到了83.4%、95.7%、89.1%。 相似文献
7.
涂燕琼 《南方冶金学院学报》2011,(3)
在基因表达式编程中,个体适应值的计算是频繁发生的操作,要动态生成和遍历大量的树,成为影响GEP算法效率的瓶颈.为此,提出了基于K-表达式长度快速求适应值的KLCF算法,实验表明KLCF算法简单有效且大大缩短演化时间;同时也提出了改进的基因表达式算法KL-GEP,实验表明,KL-GEP与GP和GEP相比,具有更高的拟合和预测精度、更快的收敛速度. 相似文献
8.
为了更好地解决高冲突证据的融合问题,提出一种3条证据直接融合的改进D-S算法.该算法首先根据证据支持贴近度函数给出识别框架下各焦元支持度的计算方法;其次根据三维证据直接融合产生的冲突因子的性质及各焦元的支持度,提出一种基于D-S证据组合规则的冲突信息加权分配算法;最后以多传感器多目标识别系统为背景进行仿真实验.理论分析和仿真结果表明,基于三维证据直接融合的改进D-S算法具有较强的抗干扰性能,能有效融合各种冲突信息,提高目标识别概率. 相似文献
9.
中文网络语言的规范化问题探析 总被引:1,自引:0,他引:1
由于网络语言失范带来的负面影响,网络语言的规范已经受到越来越多的关注,宽容、引导、多角度、互动和类别等是语言规范的五个原则.原则是理论,在理论的基础上.必须辅以正确的方法才能有效地规范网络语言.首先是语言规范,如博客、留言簿等的规范;第二是法制规范,可以借助政府及主要网络媒体得以实施;第三是道德规范,这就要求网络语言内容健康、出口文雅、评论公正,尊重他人;第四是教育措施,让受教育者学习合理地利用网络语言. 相似文献
10.
11.
为了降低人脸识别对环境条件的要求,克服光照对人脸识别的影响,通过分析人脸图像的幅频特性和相频特性,提出了频域光照归一化的人脸识别,对任何光照条件下采集的图像经过归一化后,光照与训练库中完全相同,同时保留了人脸的可区分性。人脸之间差异的信息量一般较少,运用最小非零特征向量作为人脸特征。实验仿真表明,与传统方法相比,频域光照归一化人脸识别方法对光照变化具有鲁棒性。 相似文献
12.
基于支持向量机的新生儿疼痛表情识别 总被引:1,自引:0,他引:1
研究不同的特征提取方法和分类方法在分类问题上的性能,其中包括主分量分析(PCA)、Adaboost算法、支持向量机(SVM),并进行了仿真实验.仿真结果表明,相对于使用主分量分析方法,利用Adaboost算法结合支持向量机的分类方法进行特征提取和选择的效果更好. 相似文献
13.
针对光照对人脸识别影响的问题,提出了一种改进的基于对数域多级小波分解的光照归一化方法。首先将手工裁剪后的人脸图片进行对数变换,然后将对数域图像进行多级小波分解,将低频系数置零,并将多个尺度上的高频系数分别乘以不同的高频增益,突出光照不变性分量。采用经典的PCA人脸识别算法,在耶鲁B与CMU PIE人脸数据库的实验结果表明,本文方法能有效地消除光照对人脸识别的影响,并有效提高识别率。 相似文献
14.
针对人脸识别过程中光照对识别结果的影响问题,提出了一种基于CycleGAN的光照归一化方法.使用了生成对抗式的网络结构,利用图像翻译的原理,将较亮图片的光照风格迁移至较暗图片,同时保持原人脸表面平滑且结构基本不变.使用非配对的数据集,无需人工标注标签,简化了数据准备阶段的工作,达到了利用无监督的深度学习方法去除图片光照影响的目的.最后用训练好的模型处理CroppedYale测试集,比较处理前后的人脸识别准确率.实验证明,本文方法具有较强的降低人脸光照对识别率影响的能力且基本不改变人脸结构,有利于提高人脸识别的准确率. 相似文献
15.
基于神经网络的汉语孤立词语音识别 总被引:3,自引:0,他引:3
研究了基于神经网络的中文孤立词语音识别技术;将时间规整算法与神经网络相结合,组成一个混合级联神经网络语音识别系统. 在这个模型中,第一级是时间规整神经网络. 其作用是完成时间规整功能,从输入不等长的语音信号特征矢量序列中提取固定长度的特征矢量;然后将这组特征矢量馈入后一级BP网络完成语音识别. 利用该方法对小词表汉语孤立词进行语音识别实验,获得了98.25%的正确识别率. 实验结果表明,该系统不仅利用神经网络解决了语音识别中的时间规整难题,而且识别性能明显得到改善,识别率和训练速度均优于采用线性时间规整的神经网络语音识别方法. 相似文献
16.
针对实际环境中语音信号的时频分量普遍存在部分缺失或严重失真的问题,在已知语音先验知识的条件下,提出了一种利用可靠时频分量对缺失数据进行补偿的方法。利用贝叶斯准则,将最优补偿转化为求解后验概率最大化的问题,并利用缺失数据自身的能量信息,给出了一种局部最优补偿的方法。实验表明,该方法在各种噪声、信噪比环境下,综合性能优于传统的鲁棒语音识别技术;采用缺失信息对补偿进行限定,在低信噪比下鲁棒性能有了明显的提高。 相似文献
17.
为了解决中医症状描述词的异名同义、一对多的问题,提出了一种基于预训练语言模型的2阶段症状标准化框架:第1阶段,生成候选标准症状词,参考中医症状词的定义与分类,利用多标签分类思想对原始症状词进行语义划分,进而得到相应语义标签下的候选标准症状词;第2阶段,对候选标准症状词进行排序,使用匹配模型对第1阶段得到的候选标准症状词集进行评分与排序,同时用策略对结果进行二次召回以提高症状标准化框架的性能,由此得到最终的标准化结果。实验结果表明,提出的症状标准化方法与传统方法相比能够更有效地处理症状标准化的问题。通过对比分析不同预训练语言模型在症状标准化任务上的性能,进一步说明了所提框架和策略的有效性。 相似文献
18.
贺志明 《上海工程技术大学学报》2012,26(2):180-184
提出一种基于背景规范化的照相文本图像二值方法.通过方差计算确定文本图像的文字区域,并对文字区域进行背景插值后得到原始文本图像的背景图.根据背景图把原始文本图像转换成背景规范化的文本图像,同时用拟合曲线对不同明暗背景区实行相应的对比度补偿,把前景像点与背景像点设置到较小的灰度范围,然后用全局阈值方法进行二值化处理.试验结果表明,该方法是有效的. 相似文献
19.
关系模式优化是关系数据库系统设计中的一个重点和难点,优化的最终目的是建立一个良好的关系模式。本文对规范化理论做了系统、详细的分析和研究,提出了一种基于规范化理论的方便可行的关系模式优化方法,并用实例验证了该方法的可行性。 相似文献