首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
针对中文微博中的海量文本,提出了利用领域观点词词典和支持向量机的方法对中文微博中的观点句进行识别.构建领域观点词词典,统计了表示中文微博观点句的5个特征,选取特征1,2,3,4进行观点句识别,并将基于支持向量机的3种不同特征组合识别算法与基于领域观点词词典的识别算法进行对比.算法对比结果表明,基于支持向量机的算法对微博观点句的识别效果较好,准确率68.75%,召回率48.71%,F值57.02%.  相似文献   

2.
数据清洗中,中文地址类信息对于重复记录的检测起着非常重要的作用。中文地址按照行政归属可划分为五级,通过组建地址信息数据库对中文地址进行匹配,提出基于地址树的中文地址分词技术,构建了中文地址的分词算法流程并设计了算法。  相似文献   

3.
基于双向匹配法和特征选择算法的中文分词技术研究   总被引:1,自引:0,他引:1  
传统的双向匹配算法虽然能够发现歧义现象,但是却不能解决歧义问题.为了更好地进行歧义消解,提出了一种基于双向匹配法和特征选择算法的中文分词技术,通过积累的语料库,设计并实现了一个基于两种方法的分词系统.该系统的实验结果表明,基于双向匹配法和特征选择算法的中文分词技术比传统方法的效果要好.  相似文献   

4.
抄袭源是指1篇被检测文档中抄袭的部分所在的文档集合,抄袭检测源检索的任务就是检测文章时,用最小的代价检测出尽可能多的潜在抄袭源。通过对中文抄袭检测源检索方法的研究,探索基于web的中文抄袭源检索的解决策略、具体方法和技术。  相似文献   

5.
提出了一种基于树型结构和加权熵的中文高频词提取算法.简单介绍了中文的树型结构和加权信息熵,详细叙述了算法的原理和设计步骤,并给出了具体的算法描述.实验结果表明,该算法是可行和有效的.  相似文献   

6.
为提高图书馆中文信息检索的精确度和有效性,设计了基于Lucene的语段模糊匹配中文检索系统.其采用了自然语言处理中的词语切分技术,使输入条件可以直接通过自然语言的方式提交,同时针对语段匹配的实际问题情境,设计了一种新的结果有效性判别模型,提高了检索结果相似度的科学性和准确性.经过多次实验结果的统计,搜索结果有效性可提高12%.  相似文献   

7.
针对现有中文分词算法无法为移动搜索提供用户兴趣偏好信息的现状,提出一种改进的正向最大匹配中文分词算法。该算法基于逐字二分的分词词典机制,添加词分类信息,在词典中存储了每个词条的分类信息,分词时采用改进的次字区位码哈希非均匀分段机制进行正向最大匹配分词。实验结果表明,与逐字二分法相比,改进的分词算法其存储空间增加了13%,但时间效率提高了20%左右,且分词后可同时提取出词条的分类信息。  相似文献   

8.
基于字、词、词组的中文搜索引擎分词系统   总被引:2,自引:0,他引:2  
分析了全文检索系统中常用的基于字表和基于词表的中文分词方法的优缺点,提出了基于字、词、词组混合模型的中文搜索引擎分词系统;并利用广义语词概念,设计了分词词典,改进了最大匹配分词算法(MM);最后把分词系统应用于全文检索中。  相似文献   

9.
基于多重倒排文件的中文题库全文模糊检索系统   总被引:1,自引:0,他引:1  
介绍了一个中文题库系统全文搜索引擎的设计与实现。讨论了基本多重倒排文件索引算法的全文索引组织以及基于代理的模糊检索技术,给出了系统实现模糊检索的具体方法。  相似文献   

10.
中文分词技术是中文信息处理的基础,快速、准确的中文分词方法是进行中文信息搜索的关键。基于N-最短路径的分词算法,需要计算有向图中从起点到终点的所有路径值,分词效率低,将动态删除算法与最短路径算法结合,通过从最短路径中删除部分节点的策略减少搜索路径范围,从而提高分词效率。  相似文献   

11.
基于N-Gram的文本去重方法研究   总被引:1,自引:0,他引:1  
中文文本去重是自然语言处理研究的一个重要方向。该文提出了一种基于N-Gram项和特征映射的文本去重方法。该方法提取N-Gram项的序列作为文本特征,将N-Gram项映射成哈希值,通过查找哈希值来判定文本是否重复。利用哈希数值查找代替字符串匹配,为实现快速的去重方法提供了一种新的可行的方法。实验表明,该算法对于普通网页文本去重能取得很好的效果。  相似文献   

12.
一种新的基于蚁群和凝聚的混合聚类算法   总被引:2,自引:0,他引:2  
在经典蚁群算法和经典聚合算法的基础上,该文在改进蚁群算法的同时提出了一种新的基于蚁群和凝聚的混合聚类算法。该算法首先在蚂蚁放置物体时采用紧凑算法,其次对于可被蚂蚁负载的物体采用基于评估函数的调度算法,最后将凝聚算法融入蚁群算法的迭代过程。实验通过与其它聚类算法比较表明,该算法在继承了蚁群算法固有优点的同时,提高了时间效率,获得了较好的结果。  相似文献   

13.
该文针对在机动目标跟踪领域应用广泛的交互式多模型算法,是一种基于固定模型集合的算法,由此带来一个两难问题,既需要较多的模型保证跟踪精度,有会因为太多的模型而增加计算量。该文提出了一种基于序列似然比检测的变结构多模型算法,给出了一种模型集合自适应的解决方法。该方法提高了跟踪精度的同时也降低了计算量。随着反舰导弹的威胁日益增大,该文针对反舰导弹的机动特性,仿真验证了该算法的有效性。  相似文献   

14.
为了提高关联规则挖掘的存储和挖掘效率,该文设计了一种基于逆序编码的Apriori改进算法BF-Apriori。该算法通过分析项目的概率分布并对其进行排序,经行向量逆序编码为二进制数后降低了项目读取的开销和存储开销,同时采用切片运算和剪枝技术降低了规则挖掘运算的时间复杂度。实验结果表明,BF-Apriori算法提高了数据挖掘算法中项目集的存储效率和运算速度。  相似文献   

15.
该文研究并实现了一种改进的自适应阀值的快速淘汰非匹配点的配准算法,并在次基础上实现图像拼接,利用低阀值进行快速淘汰,高阀值保证准确性的思想,并且在此基础上引入多CPU线程并行编程技术。实验结果表明,这种新型的配准改进算法,在提高准确性的基础上大大地加快了图像拼接速度,实时性能有较大提高。  相似文献   

16.
基于视觉的人手跟踪在智能人机交互中吸引越来越多的注意。该文提出一种基于粒子滤波的多相似度计算的条件密度跟踪算法。该算法主要对于非刚体运动的运动目标的输入、输出状态矩阵维数进行了降维。通过对每一粒子中的位置参数分别进行相似度验证从而显著地减少了状态矩阵的维数如旋转角度、倾斜程度等。实验数据表明,此算法能有效地对人手进行跟踪。  相似文献   

17.
该文以导弹攻击系统为例,提出了一种基于分层着色Petri网理论建立多传感器信息融合系统模型的方法。该方法运用着色Petri网理论克服了以往用普通Petri建模的不足,细化了其系统模型的中间过程,同时给出融合中心的数据融合算法和指挥中心的神经网络解析算法。基于分层着色Petri网建模与分析方法有利于融合系统的性能分析和行为仿真的实现。  相似文献   

18.
该文设计了一套基于遗传算法的人脸识别系统,整个系统包括人脸检测与定位阶段,该文采用垂直灰度积分投影算法确定了人脸左右边界,采用基于Hough变换的圆检测算法定位了眼睛中心,然后利用小范围水平灰度积分投影法确定了嘴巴中心,最后利用方框锁定、局部搜索法确定了眼角和嘴角。特征提取阶段,该文在特征矢量的质量与数量两方面做了权衡,保证了系统的运行速度。人脸识别阶段,该文采用了根据遗传学而演化的一种高精度、高搜索度算法——遗传算法训练并确定了识别系统的权重与阈值,提高了识别系统的速度与精度。在系统设计中,该文选用了两个人脸数据库共计180幅图像用于训练与检测,该系统在实验中识别正确率可达95%以上。  相似文献   

19.
根据模态置信度准则,采用模拟退火算法,提取出斜拉桥有限元模型的动力分析数据,得到了主梁加速度传感器的优化布设方案,并根据此优化方案在实际桥梁上进行了现场动力特性测试实验。对比研究结果发现:由现场实验测得的自振频率、振型位移与ANSYS理论计算出的结果十分接近,从而验证了基于MAC准则的模拟退火算法在斜拉桥加速度传感器优化布设方面是有效的和可行的。  相似文献   

20.
提出了一种适用于智能驾驶辅助系统的车道线检测算法。为了克服传统的车道检测算法中Canny边缘检测算子对阴影及光照变化较为敏感的缺点,该文对灰度图像进行二维FIR滤波之后,采用大津法实现可靠的车道边缘检测;然后利用Hough变换初步获得车道中线及消失点坐标,在此基础上采用Mid-to-Side策略进一步从边缘图像中提取车道的边界点,最后采用最小二乘拟合方法获得车道的线性双曲线模型。在各种复杂道路环境下的实验结果显示了该算法的鲁棒性和准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号