共查询到20条相似文献,搜索用时 15 毫秒
1.
An introduction to the approaches used to discretise continuous database features is given, together with a discussion of the potential benefits of such techniques. These benefits are investigated by applying discretisation algorithms to two large commercial databases; the discretisations yielded are then evaluated using a simulated annealing based data mining algorithm. The results produced suggest that dramatic reductions in problem size may be achieved, yielding improvements in the speed of the data mining algorithm. However, it is also demonstrated under certain circumstances that the discretisation produced may give an increase in problem size or allow overfitting by the data mining algorithm. Such cases, within which often only a small proportion of the database belongs to the class of interest, highlight the need both for caution when producing discretisations and for the development of more robust discretisation algorithms. 相似文献
2.
3.
基于扩张矩阵的渐进式特征子集选择算法 总被引:2,自引:0,他引:2
特征子集选择问题一直是人工智能领域研究的重要内容,特别是近几年来,特征子集选择的算法研究已经成为机器学习和数据挖掘等领域的一个研究热点。该文在扩张矩阵的基础上提出了类扩张矩阵的概念,并将加权的期望信息和不一致错误率函数应用于特征子集的选择,实现了具有噪音处理功能的渐进式特征子集选择算法———IFSS_EM,实际领域的实验结果表明:IFSS_EM算法具有运行效率高、选择特征较具有代表性的优点,从而使其能够较好地应用于实际领域。 相似文献
4.
特征选择已经成为入侵检测的一个很重要的问题,它通过求解出有用的特征子集,去除冗余特征,来达到提高分类精度和效率的目的。提出了一种基于遗传模拟退火算法的特征选择算法,以基本遗传算法为基础,将遗传操作和模拟退火操作相结合,克服了一般遗传算法的不足,有效避免陷入局部最优并最终趋于全局优化,在入侵检测的标准数据集-KDD1999上的模拟实验证明:遗传模拟退火特征选择算法能够加快特征选择的速度;并且与当前典型的特征选择算法相比,具有更好的检测率。 相似文献
5.
6.
实体化视图选择问题是NP完全问题,我们通过研究和实验,提出了一种将模拟退火算法应用到实体化视图的动态选择中的方法。在定义了算法的状态、初始状态、目标函数及转换规则之后,深入讨论了模拟退火算法的参数选择对算法解的影响。最后的实验结果表明,模拟退火算法完全可以应用到实体化视图的动态选择中。 相似文献
7.
属性选择是提高分类器性能的一种有效的方法.然而已有的属性选择算法要么假设数据无噪声,要么没有考虑属性间的交互作用,不能用于数据集中既有噪声又存在属性交互作用的情况.提出一种基于信息熵的属性选择算法,该算法用条件熵来评价属性子集对目标概念的描述能力,利用后向删除搜索策略进行属性选择.同时,根据不一致实例和关联规则中提升度的概念,给出噪声数据的定义和识别方法.该算法和典型的属性选择算法在10个UCI标准数据集上的对比实验结果表明,提出的算法在减少属性数量的同时将C4.5和NaiveBayes的平均分类精度分别提高了2.77%和3.42%. 相似文献
8.
隐马尔可夫模型训练算法是一种局部搜索算法,对初值敏感。传统方法采用随机参数训练隐马尔可夫模型时常陷入局部最优,应用于Web挖掘效果不佳。遗传算法具有较强的全局搜索能力,但容易早熟、收敛慢,模拟退火算法具有较强的局部寻优能力,但会随机漫游,全局搜索能力欠缺。综合考虑遗传算法和模拟退火算法的特点,提出混合模拟退火-遗传算法SGA,优化HMM初始参数,弥补Baum-Welch算法对初始参数敏感的缺陷,Web挖掘的实验结果表明五个域提取的REC和PRE都有明显的提高。 相似文献
9.
基于模拟退火算法和最近邻分类器识别率的特征选择方法 总被引:2,自引:0,他引:2
为了提高分类器的识别率,提出一种基于模拟退火算法和最近邻类器识别率的特征选择方法。该方法采用特征度量中的准确性度量(分类器识别率),能直接评价特征组合的优劣,并结合改进的模拟退火算法使用,能确保收敛到近似全局最优解。仿真试验表明,该方法所求解的质量优于传统特征选择方法,并且有很强的噪声容忍性,有一定的工程实用价值。 相似文献
10.
The notion of relevance is used in many technical fields. In the areas of machine learning and data mining, for example, relevance is frequently used as a measure in feature subset selection (FSS). In previous studies, the interpretation of relevance has varied and its connection to FSS has been loose. In this paper a rigorous mathematical formalism is proposed for relevance, which is quantitative and normalized. To apply the formalism in FSS, a characterization is proposed for FSS: preservation of learning information and minimization of joint entropy. Based on the characterization, a tight connection between relevance and FSS is established: maximizing the relevance of features to the decision attribute, and the relevance of the decision attribute to the features. This connection is then used to design an algorithm for FSS. The algorithm is linear in the number of instances and quadratic in the number of features. The algorithm is evaluated using 23 public datasets, resulting in an improvement in prediction accuracy on 16 datasets, and a loss in accuracy on only 1 dataset. This provides evidence that both the formalism and its connection to FSS are sound. 相似文献
11.
陈活 《数字社区&智能家居》2009,(14)
合理的配送路线可以提高物流配送的效率。针对标准模拟退火算法串行优化单个解,优化过程较长、效率较低的弱点,提出一种基于多线程模拟退火的并行机制。该机制通过将单个解的串行优化转化为多个串行解同时进行的并行的进行搜索、优化,来提高算法的整体优化效率。利用该算法求解配送路线的选择问题能够显著提高优化效率,计算结果表明该算法是有效的。 相似文献
12.
13.
免疫模拟退火算法求解TSP 总被引:2,自引:0,他引:2
文章介绍了免疫学的一些基本理论,然后在模拟退火算法及免疫算法的基础上,提出了一种新的免疫模拟退火算法求解TSP。通过对CHN144以及标准的TSPLIB中的PR1002的数据进行测试,结果表明该算法具有良好的性能。 相似文献
14.
针对现有的融合方法不能根据融合图像的后续使用目的对融合规则进行调整的问题,提出一个基于数据同化和遗传退火算法的多聚焦图像融合框架.该框架将小波变换作为模型算子,把主成分分析法作为观测算子,根据后续处理对图像各个属性指标值的依赖程度确定各个属性指标的权重;再用各个评价指标的加权和来构造目标函数;利用遗传退火算法优化目标甬数,以获取更合适的图像.最后通过一组实验证明了该框架的有效性. 相似文献
15.
The development of powerful computers and faster input/output devices coupled with the need for storing and analyzing data
have resulted in massive databases (of the order of terabytes). Such volumes of data clearly overwhelm more traditional data
analysis methods. A new generation of tools and techniques are needed for finding interesting patterns in the data and discovering
useful knowledge. In this paper we present the design of more effective and efficient genetic algorithm based data mining
techniques that use the concepts of self-adaptive feature selection together with a wrapper feature selection method based
on Hausdorff distance measure. 相似文献
16.
一种自适应的模拟退火算法 总被引:9,自引:0,他引:9
提出一种自适应SA算法,该算法根据邻域搜索进展的反馈信息,自适应确定温度变化和邻域搜索强度。对Flow shop问题的计算结果表明,该算法基本独立于初始温度的选择,具有较强的鲁棒性。 相似文献
17.
Web文本挖掘中的特征选取方法研究 总被引:11,自引:0,他引:11
研究了Web文本挖掘中的高维特征选取问题,对常见的评估函数法、主成分分析法、模拟退火法等特征选取和降维算法进行了理论分析与性能比较,通过实验对各种算法的优劣性及适用性进行了讨论。旨在通过降维处理来解决高维空间的文本挖掘问题。 相似文献
18.
基于模拟退火遗传算法的软件测试数据自动生成 总被引:16,自引:2,他引:16
傅博 《计算机工程与应用》2005,41(12):82-84
提出了一种应用于软件测试中的基于模拟退火遗传算法的测试数据自动生成算法。该算法针对测试数据自动生成的特点将遗传算法和模拟退火有机结合,充分发挥遗传算法的全局搜索和模拟退火的局部搜索优势,提高了测试数据的生成能力。实验结果表明,该算法在测试数据自动生成的效率和效果方面,优于遗传算法。 相似文献
19.
快速模拟退火法在分形数据压缩中的应用 总被引:3,自引:0,他引:3
作为一种非凸性优化技术的快速模拟退火法,可以选出局部极小区域而搜索全局状态,而且比经典的模拟退火法有更快的退火率。为了扩大历史数据的存储以及加快状态监测数据和诊断结果的传输,应用分形插值函数对实验模拟汽轮发电机组故障数据进行了压缩。采用快速模拟退火算法来计算分形插值函数的关键参数——纵向比例因子,进一步加快了数据压缩的速度。 相似文献
20.
汪渭春 《计算机与数字工程》2007,35(7):13-15
提出一种并行小生境混合遗传退火算法,并对该算法的特点和优化性能作了定性分析,该并行算法调用了MPI并行库,采用Master-Slaver结构,融入小生境淘汰技术.并应用该算法优化典型的多峰值测试函数-Shubert函数,结果表明这种并行后的算法提高原小生境混合遗传退火算法进化速度,增强全局寻优能力. 相似文献