共查询到19条相似文献,搜索用时 203 毫秒
1.
在文本聚类领域里普遍存在一种问题,文本的概念相似度却被忽略。文中利用基于词典和基于文集的本体解决这种问题。还提出一种能合适地抓住相关语义相似度的修改过的隐含语义索引模型。实验结果表明该方法要优于惯用的文本语义相似度算法。 相似文献
2.
3.
把可用于全文检索排序的信息分成两类:第一类是和用户输入的关键词直接相关的语义信息,第二类信息是文献本身的重要程度。这两类信息的不同之处在于语义信息不随时间改变,但是文献的重要性却是随着时间不断变化的。将以一个非常成功的开放源代码的全文检索软件包Lucene为例,探讨如何把不断变化的文献重要性信息及时反映到用户的检索结果中,并提出了一种分布式排序的实现方法,以提高排序的效率和实时性能。 相似文献
4.
刘静 《山西能源学院学报》2023,(4):94-96
了解企业社交网络中人员的潜在结构能帮助公司更好地了解员工和工作流程,以提高效率。现有研究多针对社交网络中的节点(即成员)进行聚类,但很少有工作关注节点在传播思想方面所扮演的特殊角色。结构聚类算法不仅可以对网络中的节点进行聚类,发现成员所属的群体,还可以找到连接群体的枢纽节点。本文将利用企业社交网络上对话消息的参与情况生成员工之间的无向图,并在其上应用结构聚类算法,以发现潜在群体并找到在企业社交网络中传播想法的枢纽角色。通过使用企业社交网络上创建的合成数据,验证了该方法在企业社交网络中发现群体角色并找到传播意见的枢纽角色的可行性和准确性。 相似文献
5.
针对目前自动答疑系统大多以关键词匹配为基础,忽视了关键词和关键词间的语义信息、问题求解准确率不足的问题,提出1种利用Ontology概念规范、语义关系明确等特点,将Ontology应用到自动答疑系统中的方法。该方法对答案库进行有效的组织,用户问题经分词并预处理后,可通过模式匹配和计算句子语义相似度2种方式返回答案,有效地提高了查询准确率。 相似文献
6.
7.
聚类是数据挖掘中用来发现数据分布和模式的一项重要技术,它是数据挖掘中的一个很活跃的研究领域,目前提出了许多聚类算法。这些聚类算法中,聚类数一般需要给定,但是在多数情况下,聚类数事先无法确定。由于各种聚类算法一般依赖于初值,即使聚类数保持不变,算法决定的聚类结果也可能有所不同,因此对同一个数据集,如何评价聚类算法给出的不同聚类结果就成了一个关键问题,这一问题人们称之为聚类有效性问题。 相似文献
8.
在对径向基概率神经网络进行理论分析基础上,采用减法聚类方法确定它的隐中心矢量。提出了基于径向基概率神经网络的变压器故障诊断方法,并进行了实验研究。实验结果表明,径向基概率神经网络在准确性和快速性方面适用于变压器故障诊断。 相似文献
9.
首先介绍潜在失效模式的定义,接着对潜在失效模式分析在SMT生产中的应用进行了研究。通过实际例子,建立8D流程,介绍风险评估系数如何分析潜在失效模式,以及如何运用于实际操作中。 相似文献
10.
首先介绍了蚁群算法及其改进;然后在聚类分析概念基础上。综合国内外研究与实践,阐述了蚁群算法的聚类应用,重点阐述了蚁群算法用于聚类的原理,蚁群聚类的算法研究、机器人、图像和网站访问客户信息等应用。最后,给出蚁群算法在聚类研究和应用的可能方向。 相似文献
11.
随着电力网络的高速发展,电力负荷数据的规模与维数急速增长。为了分析数据背后的有效信息,可以采用聚类分析的手段对电力负荷数据进行挖掘分析,为异常用户检测、能效管理提供有效的应用价值。根据美国能源信息网获得的实验数据集,利用降维算法对预处理后的数据进行降维分析,分析出不同维度下5种降维算法的降维效果,然后选择KPCA和ISOMAP降维技术与K-means聚类分析算法进行结合,比较组合算法与单独K-means算法的聚类精度与聚类效率,得出结合降维技术,可以有效提高聚类分析算法的聚类能力。 相似文献
12.
随着VOD系统中用户和影片数量的增加,在整个用户空间上搜索目标用户最近邻居的耗时也急剧增加,导致系统性能下降。本文提出了一种利用用户对影片喜好值进行聚类的推荐方法,由于其只在目标用户所属类别中搜索最近邻居,减少了搜索空间,从而有效地提高推荐系统的实时响应速度,并提高了推荐质量。 相似文献
13.
14.
15.
多煤层煤层气产层组合是后期多层合采的关键。以云南老厂雨旺区块煤层气开发井为例,选取多煤层的煤层厚度、埋深、储层压力梯度,渗透率和含气量5个关键参数,运用SPSS软件,采用Q型聚类,输出树状谱图,进行多层次产层组合分析。依据类间距远近,聚类结果可以分为大的4个层次,对应4个组合,级别越高,产层相似度越高,组合越好,一般3级组合或者4级组合是最优组合。分析发现聚类类别界面煤层大部分对应于区域煤系地层分段的关键界面煤层或者是区域盖层附近,其实质反映了地质作用的内在控制。采用Q型聚类对雨旺区块煤层气勘探开发井进行了产层组合划分,结果与其他方法划分的产层组合较为吻合,且对前期煤层气开发井聚类分析发现,多产层相似度越高,类间距越近,产气效果越好。综合说明聚类分析方法是一种间接有效的产层组合判别方法。 相似文献
16.
钻孔柱状图是地质勘查等领域的基础图件,地质调查的大规模展开和钻孔数据的保密性、安全性特点对钻孔柱状图的快速成图提出了更高的要求,现有的数据与软件绑定的钻孔自动成图系统难以满足上述要求。提出基于Web service的钻孔柱状图远程成图方法,设计了钻孔数据存储层、钻孔数据标准化层、Web service产生层和用户表现层的4层远程成图架构,进行了Web service的接口设计,基于ArcGIS Server开发了成图系统。该系统使钻孔柱状图成图变为对不同图道的Web service的“积木式”搭建,客户端软件、网络浏览器和移动终端以相同方式使用Web service进行自定义制图,具有数据保密性强、网络远程操作、自定义成图等优点,已在多家大型单位使用,具有较强的实用价值。 相似文献
17.
随着互联网用户的逐渐增多,网络管理技术已经不再属于简单的操作过程,由于网络管理不仅只管理通信设备的正常运行,还管理着网络的资源分配、安全、服务质量和各方面的性能等,因此它是一个非常复杂的管理系统。文章通过简单介绍网络管理系统,对网络管理的工作原理进行分析,同时通过对基于Web的网络管理应用及优势,阐述了基于Web的网络管理技术。 相似文献
18.
诊断柴油机故障的Fuzzy聚类分析模型 总被引:2,自引:2,他引:0
首先运用基于传递闭包的模糊等价矩阵法对原始数据进行简单分类,然后再用模糊ISODATA法进行精确分类求出最优分类矩阵和聚类中心,并依此来判断待检验样本的故障类型。实践证明,这种方法能够有效地诊断柴油机的故障。 相似文献