排序方式: 共有50条查询结果,搜索用时 15 毫秒
1.
基于词汇链的中文新闻网页关键词抽取方法 总被引:1,自引:0,他引:1
词汇链是一种词语间语义关系引起的连贯性的外在表现,提供关于文本结构和主题的重要线索。文中在解决歧义消解问题的基础上提出利用词汇链,结合词频特征、位置特征和集聚特征抽取中文新闻网页关键词的方法。该方法根据词语在文档中语义联系将文档表示成词汇链形式,并在此基础上抽取关键词。对中文新闻网页和学术期刊文献两种语料进行实验,结果表明该方法可明显提高抽取的关键词质量。 相似文献
2.
带有通配符的模式匹配问题(PMWL)模式定义的灵活性给用户提供方便,却也造成求解上的困难。目前没有任何多项式算法能得到该问题的完备解,同时也缺少足够的完备性分析。文中认为模式特征是影响PMWL完备性的关键因素,并提出模式重复度的概念,记为rep。证明在rep=0的限定条件下PMWL的完备性,同时分析rep>0时PMWL不完备的原因。实验以近似比为指标,说明rep对PMWL完备性的影响。 相似文献
3.
为了有效提高图像分类的准确率,充分利用图像本身的结构信息并压缩图像数据,首先构造三阶图像特征张量,利用非负矩阵分解(NMF)在张量子空间降维,提出了一种基于二维主成分分析(2DPCA)来得到NMF初始点的方法,保证了图像信息的有效利用.然后,为了保持降维后的张量子空间所在的流形空间的本征结构,根据图像类标构造权值矩阵,并把图像集合构造成四阶张量实现图像的分类.通过对两个图像数据库的实验,表明该方法能有效提升图像分类的准确率. 相似文献
4.
为了避免图像分割,并提高图像标注精度,提出一种基于典型相关分析(CCA)和高斯混合模型(GMM)的自动图像标注方法.利用CCA对图像的全局颜色特征与全局局部二值模式(LBP)纹理特征进行特征融合.使用融合后的语义特征,对每一个关键词建立GMM模型来估计单词类密度,从而在特征子空间中得到每个单词的概率分布.采用贝叶斯分类器确定每个标注词和测试图像的联合概率,运用词间语义关系优化标注结果.实验结果表明,使用该方法后的图像标注性能有了较大程度的改善. 相似文献
5.
6.
很多应用领域产生大量的序列数据。如何从这些序列数据中挖掘具有重要价值的模式,已成为序列模式挖掘研究的主要任务。研究这样一个问题:给定序列S、支持度阈值和间隔约束,从序列S中挖掘所有出现次数不小于给定支持度阈值的频繁序列模式,并且要求模式中任意两个相邻元素在序列中的出现位置满足用户定义的间隔约束。设计了一种有效的带有通配符的模式挖掘算法One-Off Mining,模式在序列中的出现满足One-Off条件,即模式的任意两次出现都不共享序列中同一位置的字符。在生物DNA序列上的实验结果表明,One-Off Mining比相关的序列模式挖掘算法具有更好的时间性能和完备性。 相似文献
7.
基于领域知识的预警规则发现研究 总被引:3,自引:1,他引:2
预警有助于及时预防和解决隐患,具有重要的应用价值,受到了广泛的关注.提出了一种新的预警机制,以领域相关的预警知识为基础构建预警系统,重点研究了以实际数据为资源,基于背景领域知识挖掘出预警规则,使得预警系统中的预警知识更丰富、更完备、更具有实际应用价值.将上述研究应用于高校教学教务系统的学生成绩预警,实验结果表明所提出的预警机制和方法是有效的. 相似文献
8.
对低移动性、频繁搜索文件的无线Ad-Hoc网络,提出一种新型P2P文件共享系统,介绍一种将文件查找和路由功能统一起来形成跨层的方案。所有共享文件采用全分布哈希表,在无线网络拓扑结构建立的同时存储和保留位置信息以及路由信息.通过节点间的树形逻辑结构解决共享文件的定位查询和下载问题。 相似文献
9.
针对JSEG算法在图像分割中出现的明显过分割现象,提出一种基于边缘信息的JSEG[1]改进方法。该方法首先将图像的颜色空间转换为LUV颜色空间,用PGF(Peer Group Filtering)[2]算法对图像进行平滑去噪,用分裂算法确定图像的类数,用GLA(Generalized Lloyd Algorithm)[3]算法完成量化,生成"类图"。然后计算每个像素的J值,并利用Canny算子检测的边缘信息,对J值进行修正,计算每个像素的局部相似程度,并在不同的尺寸下构建J图像,这样就能反映出最有可能的边界位置。最后在J图像上进行种子区域增长,直到获得最终的分割结果。实验结果表明该方法可以有效地改善JSEG算法在图像分割中存在的过分割现象。 相似文献
10.