排序方式: 共有40条查询结果,搜索用时 15 毫秒
1.
主题分析技术在文档聚类中的应用 总被引:1,自引:0,他引:1
为解决高频特征对文章的主题信息反映不够全面,无法获得高质量聚类结果的问题,同时为获得聚类后各类别反映信息的精确描述,采用词汇链反映文章所描述的主题信息,并依据文本间词汇链的相似度进行聚类.将聚类后属于同一类别并反映相同主题信息的词汇链进行融合,通过分析各词汇链所描述的主题信息在不同类别内的分布来抽取能够充分反映各类别主题的关键词集合.实验证明该方法比应用高频特征进行聚类的效果好,同时由于分析了主题信息在各类别内的分布情况,使抽取的类别关键词能够很好地体现每个类别所侧重描述的信息. 相似文献
2.
碳纳米管是一种新型碳材料,是碳的同素异形体,其合成方法主要有4种:电弧法、激光法、化学气相沉积法、燃烧法.燃烧法可以同时提供碳纳米管生长所必需的热源、碳源、催化剂,具有实验设备简单、常压下即可制备等优点,是目前研究合成碳纳米管的热点技术.综述了该领域国内外的研究状况,详细介绍了各自的实验设备及方法,分析比较了各种方法的优缺点.重点阐述介绍了一种新的合成方法--V型热解火焰法,通过实验证明其是一种较好的碳纳米管制备方法.该方法可以实现碳纳米管的可控制生长,并且能实现工业化生产,是一种极具发展潜力的燃烧合成技术. 相似文献
3.
目的为了有效地预测用户在信息检索过程中可能点击的检索结果,从而进行网页的智能推荐.方法采取网络日志挖掘的技术,通过词频信息和知网(HowNet)中词的概念计算模型计算网页文档间的主题相关度,再将该语义信息与统计模型计算的条件概率值相结合,以此作为网页推荐的依据.结果提出了一种检索推荐统计模型,并构建了相应的原型系统,实验表明该方法显著提高了推荐系统的准确率.结论这项技术有效地提高了推荐结果与用户信息需求的相关程度,使推荐系统的性能获得了较大地提高,可以很好的应用于信息检索的智能推荐服务领域. 相似文献
4.
5.
词的重要性评价是关键词抽取研究中比较重要的环节,其中一种比较常用的方法是对词的相关属性进行加权分析,并根据综合权值确定重要性程度.词所处的位置、词频、词性以及与线索词的同现信息等都是影响关键词抽取的重要因素.本文首先对可能影响关键词抽取的因素进行了探讨和分析,而后利用遗传算法对各个知识源参数进行了优化.在人工标注的语料上进行的测试结果验证了该方法的可行性. 相似文献
6.
7.
WNS型燃气锅炉因其结构简单、节能、环保、效率高等特点受到人们广泛关注。燃气锅炉在国内的需求量每年逐渐上升。燃气锅炉炉膛出口烟气温度的大小对燃气锅炉的性能有直接影响,而燃料的种类、炉膛的形状和过量空气系数对炉膛出口烟气温度有着重要的影响,尤其是过量空气系数。为了详细研究炉膛出口烟气温度的影响因素,利用FLUENT软件对直形炉胆和波形炉胆数值进行模拟;过量空气系数取1.05、1.10、1.15、1.20、1.25;分别选用天然气、炼焦煤气和液化石油气3种燃料。通过对不同种工况下炉膛的燃烧进行数值模拟,得出理论分析数据,可以为WNS型燃气锅炉的实际运行、优化设计和制造提供理论支持,具有一定的工程应用价值。 相似文献
8.
针对超光谱图像压缩进行了研究,提出了一种有效的基于分布式信源编码(Distributed Source Coding, DSC)的有损压缩算法。该算法利用多元陪集码和标量量化的方式实现超光谱图像的分布式有损压缩,针对分布式信源编码,利用多波段预测的方式为每个编码块构造边信息,然后采用标量量化的方式对编码块和其边信息同时进行量化处理。根据分布式信源编码原理,给出了各编码块量化后的编码码率。为了减少标量量化带来的信息丢失,算法引入了跳跃策越。部分均方误差意义上损失较大的编码块将由其边信息直接代替。实验结果表明,所提出的算法性能与基于小波变换的算法性能相当;此外,该算法复杂度较低,适合星载超光谱图像的压缩。 相似文献
9.
为了辅助进行产品评论中特征-观点对识别的挖掘工作,对细颗粒度产品评论语料库的构建技术进行了研究.介绍了用于产品评论细颗粒度挖掘的语料库构建方法,以及目前初步进行的语料标注工作.标注数据可以数据库形式存储,从而实现了无结构化到结构化的转变,为自动查询等处理提供了极大方便.实验结果表明:虽然文中的标注方法以手机产品为例,但具有良好的移植性,可以应用到其他产品评论的细颗粒度语料库构建.相应的语料库构建对于高性能机器学习方法的应用、特征-观点对识别算法的性能提高以及自动评价等具有重要意义. 相似文献
10.
信息检索中的聚类分析技术 总被引:1,自引:0,他引:1
信息检索/搜索引擎技术的快速发展使得信息的查全率有较大提高,而查准率以及人们获取信息的效率改善却不明显。文本聚类和多文档关键词的自动生成技术将有助于解决这一问题。其基本思想是对检索到的部分文档进行聚类处理,并对每类文档自动生成关键词,从而帮助用户判断各个类别的文档和检索需求是否相关。该文提出文档相关度和类别相关度的概念,并利用词频信息以及知网(HOVNET)中词的概念计算模型计算类别相关度,将其作为聚类合并的依据。信息获取的仿真实验表明文档检索效率有较大提高。 相似文献