首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
一种基于向量空间模型的文本聚类方法   总被引:1,自引:0,他引:1  
研究了一种基于向量空间模型的文档聚类方法.提出了一个新的聚类模型,即在传统聚类模型的基础上增加一个文档特征向量调整模块;给出了一个特征评价函数用以进行特征提取;对一种基于相似度的平面划分聚类算法做了一些改进.实验结果表明本文提出的聚类模型是可行的.  相似文献   

2.
专利文献是现代生活中必不可少的情报源它具有及时广泛、新颖、可靠,详尽等显著优点。随着我国专利制度的建立和专利法的实施,专利文献越来越多,利用范围越来越广,对检索专利文献的要求也越来越高。本文旨在介绍一些专利文献知识和简单的检索方法,以便让广大读者认识到专利文献的作用,  相似文献   

3.
针对向量空间模型忽略词语出现位置和词序的缺点,结合科技文献结构明显分层的特点,本文提出了基于N层向量空间模型的文本相似度计算方法.该算法首先用N层向量空间模型表示查询短语和科技文献,其次在词频角度上和词序角度上分别计算两者间的相似度,最后得出整体的文本相似度.将本文算法应用于中、朝、英对照科技文献多语种检索模块测试其有效性,测试结果表明,本文设计的文本相似度计算方法算法性能较好,与传统的向量空间模型余弦相似度算法相比,查准率提高了2.7%,MRR提高了2.02%.  相似文献   

4.
针对如何根据用户的检索状况来提高信息检索的反应速度及查询的准确性的问题,利用向量空间模型信息检索与路径相似度蚁群算法中利用同一方式——相似度来决定下一步方向的共同特点,提出将一种基于路径相似度的蚁群算法应用于信息检索的方法。采用这种算法在性能和收敛性速度上优于常规算法。  相似文献   

5.
基于中文文本分类的定义和向量空间模型,本文分析了正确分类文本的关键所在.通过对传统的特征选择方法的分析,提出了新的特征选择方法.通过支撑向量机对中等规模语料库的实验,验证了此方法的有效性.  相似文献   

6.
文本分类中特征项权重的计算方法   总被引:4,自引:0,他引:4  
特征项权重的计算方法是基于向量空间模型的文本分类中一个核心问题,计算方法的选择关系到最终分类的效果.本文对文本分类中特征项权重的计算方法进行了说明,并根据实验对几种特征项权重的计算方法进行了比较。  相似文献   

7.
基于贝叶斯分类的邮件过滤方法及模型研究   总被引:6,自引:1,他引:5  
垃圾邮件日益泛滥,给用户带来了极大的不便和危害.并对网络安全构成威胁.传统邮件过滤方法单一,过滤精度不高,已不能很好地满足需求.结合规则过滤技术,分析了基于文本内容的贝叶斯分类器实现的关键技术与方法,并给出核心过滤算法在邮件分类中的实现具体方法及过程,进而完成垃圾邮件的判别.为减少邮件的误判对用户造成的损害及垃圾邮件漏判造成的影响,提出相应的改进措施,使用最小风险贝叶斯决策减小误判率,对分类系统经训练部分进行自适应调整,最后给出基于规则与内容的双重防范机制的邮件过滤模型及基于该框架的邮件判别流程.  相似文献   

8.
基于空间金字塔的BoW模型图像分类方法   总被引:1,自引:0,他引:1  
针对不同场景图像下词袋(bag of words,BoW)模型的图像分类准确率较低的问题,提出了一种基于空间金字塔BoW模型的图像分类方法。该方法通过尺度不变特征变换(scale-invariant feature transform,SIFT)算法提取原始图像像素特征点作为视觉特征,对相似视觉特征进行聚类形成视觉词袋,并采用空间金字塔方法对视觉词袋进行划分,构建空间金字塔的BoW模型,通过支持向量机分类器对分层后的视觉词袋进行图像分类。分别使用BoW模型和空间金字塔的BoW模型分类方法对网络图像数据库进行分类实验对比,结果表明,空间金字塔BoW模型能有效提高BoW模型的图像分类准确率。  相似文献   

9.
为了提高文本信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的修正的向量空间模型(MVSM).该模型重新定义了查询索引项的内容,将修饰词与中心词组成的合成短语引入到查询语句及传统的向量空间检索模型的信息表示中,并重新计算作为特征索引项的合成短语的权重值.在此基础上,又对查询索引项使用了基于同义词词典的查询扩展策略.实验结果表明:用合成短语作为查询索引项进行检索,使检索能够在相对精确的范围内进行,提高检索查准率;对查询进行同义扩展,能够使更多的语义相关的文本被检索出来,提高检索查全率.因此,在信息检索系统中应用修正的向量空间模型能够较好地改善检索性能.  相似文献   

10.
中文文本分类中基于词性的特征提取方法研究   总被引:6,自引:0,他引:6  
在介绍常用的文本分类中特征词提取方法的基础上,提出了一种全新的,适用于中文文本分类的特征提取方法——基于词性的特征提取方法,实验结果显示,这种基于词性的特征提取方法在提高特征提取效率和降低特征向量维数方面都有显著改善。  相似文献   

11.
文章研究了基于向量空间模型的文本分类中特征词权重算法,综合考虑特征词在文本中出现的位置信息,提出一种改进算法并给出实验结果。  相似文献   

12.
采用离散空间电压矢量调制方法的异步电机直接转矩控制   总被引:9,自引:0,他引:9  
异步电机直接转矩控制(DTC)方法在数字实现时,由于电压矢量个数的有限和采样及数值运算带来的滞后,使稳态输出转矩的波动大于给定转矩容差,采用离散空间矢量调制(DSVM)方法可以在不增加功率管开关频率的前提下明显改善转矩和电流波动(尤其在低速时),且不增加系统和电路的复杂性,仿真实验证明了该方法的有效性。  相似文献   

13.
基于贝叶斯算法的垃圾邮件过滤技术   总被引:8,自引:0,他引:8  
对基于朴素贝叶斯算法的垃圾邮件过滤技术进行了研究分析和实验验证.介绍了向量空间模型(VSM)方法以及特征向量抽取方法,推导和研究了引入“特征之间互相独立”假设的朴素贝叶斯分类算法.采用K次交叉验证的方法,以收集的一些邮件为语料,应用朴素贝叶斯分类算法,通过训练集计算得到类别的先验概率和特征项的类条件概率,并以此为基础对测试集中的邮件进行归属判断,以正确率和召回率为指标给出了实验结果.  相似文献   

14.
基于贝叶斯扩张树的文本分类算法   总被引:1,自引:0,他引:1  
将文本的特征作为贝叶斯网络的节点,根据样本数据计算节点之间的互信息,并且将它们作为网络中边的权。利用 Kruskal 算法构造了一种简单的贝叶斯网络—贝叶斯扩张树,使它具有最大对数似然值。利用贝叶斯条件概率公式,将贝叶斯扩张树作为分类器对文档集中的文档进行分类。  相似文献   

15.
基于K-最近距离的自动文本分类的研究   总被引:13,自引:1,他引:13  
提出并实现了利用统计词频信息和语言信息相结合的方法选择特征,计算特征的权重值时不仅考虑词频,还利用了特征的集中度、分散度.经过训练和统计对每一类文本形成特征的权重向量,利用K-最近距离的方法对测试集进行分类.对英文文本的测试结果表明,该算法提高了文本分类的准确率.  相似文献   

16.
对传统向量空间模型的变量加以改进,通过采用线性子空间方法和独立分量分析方法(ICA)来解决向量空间的降维问题:通过特征词提取,把每个文档与其文档特征向量一一对应;采用ICA对文档特征向量做进一步处理,利用统计的方法寻找特征词之间的语义结构,使向量组合的表示形式具有直观的语义解释,在提取更好的数据分布特征的同时有效地降维...  相似文献   

17.
空间矢量脉宽调制(SVPWM)技术特点及其优化方法   总被引:8,自引:0,他引:8  
从电压利用率、调制波分析和开关损耗几个方面分析了电压空间矢量脉宽调制(SVPWM)技术与常规正弦脉宽调制(SPWM)技术的区别和联系,给出了SVPWM技术的几种优化措施.理论分析和仿真结果表明将每相电压正、负半周各6 0°的不开关扇区对称分布于电流峰值两侧的优化SVPWM调制技术是最为理想的控制策略.实际系统的运行结果证明,采用这种调制技术后,控制器的效率得到了显著提高  相似文献   

18.
一种可验证的矢量空间动态密钥共享方案   总被引:1,自引:0,他引:1  
提出了一种可验证的矢量空间密钥共享方案,其安全性依赖于椭圆曲线密码的安全性。该方案具有如下特点:使(t,n)门限密钥共享方案中受托人的权限必须相同的前提条件可以推广到一般的情况;提供了验证的手段,可以检验出密钥分发者或密钥受托人的欺诈行为;分发的子密钥通过椭圆曲线密码进行了加密,使得受托人掌握的子密钥是加密后的密文形式,增强了安全性;同时,由于椭圆曲线密码体制具有加密强度高、密钥短的优点,使得该方案特别适合于计算、存储、带宽要求严格的场合。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号