首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
基于标记的规则统计模型与未登录词识别算法   总被引:8,自引:0,他引:8  
该文针对小型词库,提出了基于规则统计模型的消歧方法和识别未登录词的词加权算法。通过大量语料库学习获取歧义高频字,作为歧义标记,利用规则统计模型对标记的上下文信息分类处理,剩下的部分进行正向或逆向动态最大匹配,对连续单字串使用词加权算法来判断其是否为未登录多字词。经过实验测试,该系统的准确率为98.88%,召回率为98.32%。  相似文献   

2.
皮乾东  邵玉斌  龙华  杨陈菊 《控制工程》2021,28(12):2318-2322
为改进传统的汉语句法分析算法,采用自顶向下、逆向扫描的分析方法,结合汉语语序的重要特性,提出了一种改进自左向右(left to right,LR)分析算法的汉语层次化句法分析器设计方法.该分析器仅基于当前经验得出十几条汉语语序特征,不断逆向扫描语句,结合上下文无关文法和汉语语序规则进行移进-归约处理,进而得到汉语层...  相似文献   

3.
从一维有趣的Bug人工生命模型出发,并对该模型进行扩展,让agent(Ant或Particle)运动在一维细胞自动机上,通过设置细胞自动机中细胞的内部状态以及细胞的转换函数,提出了适于求解二元离散优化问题的二元蚁群算法和二元粒子群算法模型,这不仅体现了计算的本质,而且具有较强的实用价值!  相似文献   

4.
提出一种基于二元蚁群算法的分类规则挖掘算法.针对蚁群算法计算时间长的缺点,引入一种变异算子,同时为了避免蚁群算法陷入局部最优,又引入灾变算子.通过对美国加州大学机器学习数据集中的测试集进行测试表明,该算法的预测准确率能较大提高.实验同时显示引入变异算子和灾变算子能有效节省计算时间和防止陷入局部最优.  相似文献   

5.
周蕾  朱巧明 《计算机工程》2007,33(8):196-198
介绍了一种基于统计和规则的未登录词识别方法。该方法分为2个步骤:(1)对文本进行分词,对分词结果中的碎片进行全切分生成临时词典,并利用规则和频度信息给临时词典中的每个字串赋权值,利用贪心算法获得每个碎片的最长路径,从而提取未登录词;(2)在上一步骤的基础上,建立二元模型,并结合互信息来提取由若干个词组合而成的未登录词(组)。实验证明该方法开放测试的准确率达到81.25%,召回率达到82.38%。  相似文献   

6.
一种基于GIS的网络层次化地图模型及实现算法   总被引:3,自引:0,他引:3  
王恺  杨峰  毕经平 《计算机工程》2005,31(6):12-15,86
大型计算机网络地域分布广,网元数目众多,传统网络管理系统以网络拓扑这种虚拟空间的方式实现网络的监控管理,没有充分利用网元的地理位置信息,网络监控和管理存在不便之处.地理信息系统(GIS)的应用能够赋予网络监控管理系统清晰直观、易于监控和管理的特性.通过建立一种基于GIS的网络层次化地图模型,系统解决了网络拓扑与GIS地图有效结合这一问题,实现了在GIS地图中网络拓扑与运行状态信息的层次化管理,给出了网络GIS地图的生成、维护的非递归算法.模型和算法的有效性和完备性在大型网络性能监测与分析系统NIPMAS中得到了实际验证.  相似文献   

7.
基于图算法的二元组合文法分析   总被引:1,自引:1,他引:0  
为解决二元组合文法(BCG)的算符优先计算分析中不能共享分析树空间的问题,并降低分析算法的空间花费以提高分析效率,提出了一种基于图算法的BCG分析方法。该方法以表格方式存储分析过程中产生的所有边,分析完成后根据边的跨度构造分析树,从而使边不再局限于某一特定分析树中,再根据BCG文法的特性实现分析过程中的剪枝。实验结果表明,该方法在花费的时间、产生边的数量和最终结果树的数量上都明显低于传统的图算法和基于算符优先的算法。  相似文献   

8.
基于统计和规则的未登录词识别方法研究   总被引:8,自引:0,他引:8       下载免费PDF全文
周蕾  朱巧明 《计算机工程》2007,33(8):196-198
介绍了一种基于统计和规则的未登录词识别方法.该方法分为2个步骤:(1)对文本进行分词,对分词结果中的碎片进行全切分生成临时词典,并利用规则和频度信息给临时词典中的每个字串赋权值,利用贪心算法获得每个碎片的最长路径,从而提取未登录词;(2)在上一步骤的基础上,建立二元模型,并结合互信息来提取由若干个词组合而成的未登录词(组).实验证明该方法开放测试的准确率达到81.25%,召回率达到82.38%.  相似文献   

9.
规则与统计相结合的兼类词处理机制   总被引:5,自引:0,他引:5  
兼类词处理是词性标注的关键所在,本文对兼类词排岐进行了研究,介绍了规则和统计相结合的排岐策略.按照上述策略,实现了一个兼类词处理系统.实验测试结果表明,利用规则与统计相结合的兼类词处理机制可以有效地提高排岐正确率和词性标注正确率,在封闭测试和开放测试中兼类词的排歧正确率分别达到了93.91%和91.16%,标注正确率分别达到了97.85%和96.71%.  相似文献   

10.
人脸的层次化描述模型及识别研究   总被引:7,自引:0,他引:7  
人脸自动识别是一个困难但有重要意义的工作。文中提出了一种基于人脸层次化描述的识别方法。该方法首先对人脸进行快速准确的特征定位及标准化,然后采用主元分析神经网络分别对定位的人脸及其特征区域进行最佳特征提取,从而得到人脸在低分辨率和较高分辨率上的两层特征描述用以识别,具有识别率高、特征数据量适中、可用于大量人像识别等特点。此方法在1300幅人像上进行了测试,结果表明其在人脸转动、表情变化或入脸未经训练  相似文献   

11.
赵亚琴  周献中 《计算机应用》2005,25(6):1339-1341,1344
提出并实现了一种基于神经网络的GLR(Generalized LR)句法分析算法,该算法结合神经网络自学习、自组织和并行分布处理等优点,以BP神经网络结构模型取代了GLR算法的分析表,模拟其移进和归约动作,通过计算网络输出来分析句法结构。该分析算法较好地解决了GLR算法对于存在多个移进归约冲突动作时,复制分析栈会使得动作表变得很大的缺点,实验结果表明,这种算法具有较好的泛化能力。  相似文献   

12.
为了提高句法分析器的分歧能力和分析准确率,结合上下文无关概率模型PCFG和头驱动概率模型HDSM各自的优点,提出了一种新型的概率模型PCFG_HDSM,并基于GLR算法,实现了一个新型的汉语句法分析器。在词性标注阶段,通过对助词的详细标注使部分歧义在规则阶段就被去除掉,提高了系统消歧的能力。经过开放测试,准确率和回归率分别达到82.8%、74.7%,与其他分析器分析结果比较有了较大提高,证明新模型PCFG_HDSM确实提高了分析器的分歧能力。  相似文献   

13.
当前二进制文件比对技术主流是以BinDiff为代表的结构化比对方法,存在结构相似导致的误匹配、分析耗时较高的问题。针对该问题提出一种基于节点层次化、价值化的匹配方法。通过提取函数节点在函数调用图中的层次与函数在调用网络中的价值,对层次模糊的节点提供了节点层次估算算法,最后递归匹配节点。实验表明,该方法避免了结构相似导致的误匹配,其时耗低于结构化比对工具Bindiff的1/2,节点匹配数量减少在15%以内。该方法可有效提高嵌入式设备固件的跨版本相似性分析效率。  相似文献   

14.
罗亚男  付永庆 《计算机应用》2013,33(6):1763-1766
为了提高路径规划的效率,提出了一种基于分层路网的二叉堆管理开启列表启发搜索算法。首先根据路网分级特点的存在,建立分层地图数据库,然后以启发式A*算法为主搜索方式,结合优先队列二叉堆来管理开启列表,完成路径规划。通过实验对比不同路径规划算法的平均耗时显示:启发式A*算法的效率是盲目式Dijkstra算法的4倍左右,同时在算法中引入二叉堆至少节省5%的规划时间。分层策略使快速路段所占比例达到90%以上,且将路径规划耗时控制在3s以内。实现结果表明,所提算法具有很高的运行效率,同时能满足驾驶者多走快速路段的行车心理。  相似文献   

15.
针对单处理器后序遍历二叉树的时间复杂度为O(n)问题,提出了在EREW PRAM并行计算模型下一种后序遍历二叉树的算法。将后序遍历二叉树的边构造一个单链表,使用指针跳越技术对单链表进行表序问题求解,从而得到后序遍历二叉树结点的顺序。得出了运用该算法将时间复杂度从O(n)减少到O(logn)的结论。  相似文献   

16.
金亮  于炯  杨兴耀  鲁亮  王跃飞  国冰磊  廖彬 《计算机应用》2017,37(10):2828-2833
目前推荐系统存在评论数据稀疏、冷启动和用户体验度低等问题,为了提高推荐系统的性能和进一步改善用户体验,提出基于聚类层次模型的视频推荐算法。首先,从相关用户方面着手,通过近邻传播(AP)聚类分析得到相似用户,从而收集相似用户中的历史网络视频数据,进而形成视频推荐集合;其次,利用用户行为的历史数据计算出用户对视频的喜好值,再把视频的喜好值转换成视频的标签权重;最后,通过层次分析模型算出视频推荐集合中用户喜好视频的排序,产生推荐列表。基于MovieLens Latest Dataset和YouTube视频评论文本数据集,实验结果表明所提算法在均方根误差和决策精度方面均表现出良好的性能。  相似文献   

17.
唐凯 《计算机工程与应用》2007,43(3):168-172,193
提出了一种以XML文件内在的分层结构为基础的文件分类方法,井与改良的VSM方击的实验结果进行了比较。和以往XML文件的分类方法不同的是.此方法更加注重XML文件特有的结构信息。首先利用TF-IDF方法针对XML文件非蛄构的信息产生一般特征集,然后再针对XML文件各个屡次重要性赋予一定的权重。从而产生层次特征集,然后根据一些领域知识,产生知识特征榘。将三个特征集结合起来对XML进行分类。试验结果表明,这种方法比改良的VSM方法在分类的准确性方面有大幅的提高。  相似文献   

18.
基于二元蚁群算法求解组卷问题   总被引:2,自引:2,他引:0  
通过分析组卷的数学模型及目标函数,抽象出组卷模型实质是一个多目标线性规划模型,并将二元蚁群算法用于求解组卷问题。由于采用二进制编码,任意时刻每只蚂蚁只需根据其面前两条路径上的信息素强度决定该题选或不选,这对单个蚂蚁的智能行为要求非常低,而且存储空间也相对减少。实验结果表明,该算法能快速有效地完成组卷过程,具有较强的实用性。  相似文献   

19.
对于二分类问题,基于判别模型的分类器一般都是寻找一条最优判决边界,容易受到数据波动的影响。针对该问题提出一种基于生成模型的Q-learning二分类算法(BGQ-learning),将状态和动作分开编码,得到对应各类的判决函数,增加了决策空间的灵活性,同时在求解参数时,采用最小二乘时序差分(TD)算法和半梯度下降法的组合优化方法,加速了参数的收敛速度。设计实验对比了BGQ-learning算法与三种经典分类器以及一种新颖的分类器的分类性能,在UCI数据库七个数据集上的测试结果表明,该算法有着优良的稳定性以及良好的分类精确度。  相似文献   

20.
Feature selection is a significant task for data mining and pattern recognition. It aims to select the optimal feature subset with the minimum redundancy and the maximum discriminating ability. In the paper, a feature selection approach based on a modified binary coded ant colony optimization algorithm (MBACO) combined with genetic algorithm (GA) is proposed. The method comprises two models, which are the visibility density model (VMBACO) and the pheromone density model (PMBACO). In VMBACO, the solution obtained by GA is used as visibility information; on the other hand, in PMBACO, the solution obtained by GA is used as initial pheromone information. In the method, each feature is treated as a binary bit and each bit has two orientations, one is for selecting the feature and another is for deselecting. The proposed method is also compared with that of GA, binary coded ant colony optimization (BACO), advanced BACO (ABACO), binary coded particle swarm optimization (BPSO), binary coded differential evolution (BDE) and a hybrid GA-ACO algorithm on some well-known UCI datasets; furthermore, it is also compared with some other existing techniques such as minimum Redundancy Maximum Relevance (mRMR), Relief algorithm for a comprehensive comparison. Experimental results display that the proposed method is robust, adaptive and exhibits the better performance than other methods involved in the paper.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号