首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对传统差异表达基因分析方法使用单一数据集,不能处理异质性特性数据集、分析结果偏差大的问题,提出了联合驱动排除的概念,设计实现一种使用多研究数据集的元分析算法。应用公共数据库GEO中GDS2490和GDS2491数据集对设计的算法与微芯片显著性分析方法进行了对比。实验结果表明:设计的算法可以对数据集实行联合驱动排除,与微芯片显著性分析方法相比,可以有效分析异质性特性的数据集,准确找到差异表达的基因,验证了算法的有效性。该方法为差异表达基因识别提供了新思路。  相似文献   

2.
不同实验条件下差异表达基因(DEGs)的识别是微阵列数据分析的主要目标之一,针对分析结果中具有高排名的基因往往表现出较低差异表达水平的缺点,提出了一种基于简单统计排名模型的差异表达基因识别算法MRP(Matrix rank product)。算法可直接处理基因芯片原始数据,排除了数据预处理方法对算法的干扰;另外,通过对基因芯片数据形成的矩阵进行整体排序计算,得到具有高准确度的差异表达性排名结果。  相似文献   

3.
针对RankComp算法存在统计效能低的问题,为提升统计效能,提出RankComp+算法。RankComp+算法通过调整RankComp算法筛选稳定基因对的策略,并添加差异表达基因迭代筛选过程对RankComp算法进行改进。在仿真数据实验和肺癌配对样本数据实验中,RankComp+算法均表现稳定且优于其他算法。在缺血性心肌病数据中,RankComp+算法找出的差异表达基因显著富集到新的生物学通路,证明了RankComp+算法得出的结果具有生物学意义。综上,RankComp+算法能够稳定用于个体化差异表达基因识别并为疾病机理研究提供新的信息。  相似文献   

4.
基于加权信息熵相似性的协同过滤算法   总被引:1,自引:0,他引:1  
协同过滤算法是推荐系统中最为成功的技术之一,相似性计算是协同过滤算法的核心.针对传统的相似度计算方法在数据稀疏的情况下推荐不准确问题,提出了基于项目间差异信息熵的相似度计算方法,先通过差异值和共同评价数目对信息熵进行加权,再归一化处理来计算项目间的相似度.用基于项目(Item-based)相似性的协同过滤算法进行了实验验证,实验结果表明,该算法提高了个性化推荐精度.  相似文献   

5.
针对传统协同过滤推荐算法在用户评分数据极端稀疏情况下无法取得令人满意的推荐质量问题,结合User-based 和Item-based 协同过滤算法思想,提出了一种基于选择性预测策略的协同过滤推荐算法,算法利用高相似度阈值来计算用户相似性和项目相似性,并通过形成用户最近邻居集和项目最近邻居集来预测填充评分矩阵。基于Movielens数据集的实验表明,改进的算法有效改善了传统协同过滤推荐算法的数据稀疏性和扩展性问题,明显提高了系统的推荐质量。  相似文献   

6.
Lucene的最小风险概率加权朴素贝叶斯算法   总被引:1,自引:0,他引:1  
为了提高垃圾邮件过滤的准确性,在分析垃圾邮件数据的基础上,对比信息检索与信息过滤之间的关系,将信息检索框架Lucene应用到垃圾邮件过滤系统中,提出最小风险概率加权的朴素贝叶斯算法,与最小风险法结合,有效地减少贝叶斯方法的独立性约束.实验验证了加权朴素贝叶斯算法的有效性.  相似文献   

7.
结合Filter和Wrapper方法的优点,提出一种基于集成遗传算法(FSEGA)的特征选择方法,用于从基因表达谱数据中选择特征基因。根据基因正负样本的分布关系定义信息指标过滤噪声基因,在递归特征消除过程中根据基因的集成权值生成候选基因子集,选择分类测试中具有最高AUC(接收者工作特征曲线下的面积)值的候选基因子集作为基因表达谱数据集的特征基因子集,将支持向量机(SVM)用于算法的适应度函数,研究FSEGA方法与分类器算法之间的关系,对5个肿瘤特征基因表达谱数据集进行基因选取实验。结果表明,采用提出的集成特征选取方法选取的特征基因集合含丰富类别信息,重复性较好,提高了肿瘤特征基因选取的稳定性和鲁棒性。  相似文献   

8.
一种改进的协同过滤推荐算法   总被引:2,自引:0,他引:2  
针对User-based协同过滤推荐和Item-based协同过滤推荐算法的不足,提出了一种改进的推荐算法。该算法融合User-based协同过滤推荐和Item-based协同过滤推荐算法思想,通过形成项目相似集来填充用户评分矩阵,并利用高评分阈值来计算用户相似性,有效改善了传统协同过滤推荐算法的数据稀疏性和实时性。实验结果表明,该算法可以显著提高推荐系统的推荐质量。  相似文献   

9.
利用聚类方法计算用户相似度,结合协同过滤思想构建个性化推荐算法,对中药材电子商务交易数据的样本进行实验验证,实验证明融合聚类和协调过滤的推荐算法在推荐效果方面优于传统的协同过滤推荐算法.将此算法运用于中药材电子商务交易平台中,构建个性化推荐模块,提高平台的个性化服务能力.  相似文献   

10.
针对微阵列表达数据集中基因-基因之间存在复杂相关关系的问题,基于随机森林变量重要性分数,提出了一种新的加权K-均值基因聚类算法。首先,以微阵列表达数据中的样本为对象、基因为特征,训练随机森林分类器,计算每个基因的变量重要性分数;然后,以基因为对象、样本为特征、基因的变量重要性分数为权重进行K-均值聚类。在Leukemia、Breast、DLBCL等3个微阵列表数据集上进行了实验,结果表明:所提出的加权K-均值聚类算法与原始的K-均值聚类算法相比,类间距离与总距离的比值平均高出17.7个百分点,具有更好的同质性和差异性。  相似文献   

11.
推荐系统是解决目前信息过载问题的有效工具和方法,而在各种推荐算法中,协同过滤推荐算法的应用最为广泛但是,基于协同过滤的推荐算法存在稀疏矩阵的问题,即:当矩阵过于稀疏时,其推荐结果误差较大针对这一问题,提出了一种基于内容和协同过滤的组合推荐算法,并通过实验的方式与传统的协同过滤推荐算法进行了比较实验数据表明,这种组合推荐算法具有较高的效率。  相似文献   

12.
为了提高表达效率,提出了新的基因解码方案,形成了内嵌基因表达式编程算法EGEP;提出了极大表达树、嵌套表达树和拼接表达树等概念;分析了基因的表达空间和算法的复杂度.实验表明,该算法提高了函数发现的成功率;在小规模种群的函数中其能力明显优于GEP.在单基因情况下,目标为一元函数和二元函数时,EGEP平均成功辈数分别为GE...  相似文献   

13.
提出了一种通过降低用户评分矩阵维数来解决数据稀疏问题的协同过滤算法(基于项目多类属概率潜在语义的协同过滤算法).首先将概率潜在语义分析法中的隐变量集固定为项目的多类属集,明确隐变量的意义,限制隐变量的变化范围; 而后迭代学习隐变量的分布,即用户的兴趣模型,压缩用户评分矩阵; 最后用学到的兴趣模型度量用户的相似度,对目标用户做出推荐. 仿真实验结果表明: 该算法有效解决了数据稀疏问题,平均绝对误差低于基于记忆的协同过滤算法4%; 与通过概率潜在语义分析法降低用户评分矩阵维数来解决数据稀疏问题的协同过滤算法相比,该算法明确了隐变量的意义,提高了对系统的理解,并取得了富有竞争力的推荐性能.  相似文献   

14.
协同过滤技术研究综述   总被引:1,自引:0,他引:1  
协同过滤作为构建个性化推荐系统的主要技术,旨在解决各领域的信息过剩问题,其主要类型包括基于记忆、基于模型以及组合协同过滤算法。分析了基于记忆的协同过滤方法的基本原理,介绍了4种典型的基于模型的方法及3类组合协同过滤算法,并从行为数据的构造、数据分割的方法及常用评估指标3方面阐述了协同过滤的算法性能的验证方法,总结了协同过滤算法在构建推荐系统时面临的问题和各类协同过滤算法的性能。单一协同过滤算法的推荐性能各有优劣,构建个性化推荐系统的关键在于:针对推荐任务的需求及数据集的特点,选择合理的推荐算法与评价指标。  相似文献   

15.
提出了一种加权的基于LDA(Latent Dirichlet Allocation)的协同过滤算法,通过对传统协同过滤算法优缺点的分析,联合打分数据和评论数据的特征进行推荐。该算法主要研究用户评论文本的特点,通过LDA主题模型对评论文本集合进行主题提取,使用相对熵的方法计算相似度,在此基础上,研究用户评分对于每条评论文本的影响,联合LDA进行评分预测及推荐。实验结果表明,该算法能够显著提高推荐准确度。  相似文献   

16.
针对传统矩阵分解算法在处理海量数据时所面临的性能瓶颈以及大量数据的关键特征缺失问题,本文基于并行化矩阵分解算法对推荐系统效率进行提升,使用朴素贝叶斯分类算法提高推荐的准确率.首先基于TF-IDF算法构建图书评论的情感词典;然后结合朴素贝叶斯算法完善缺失关键特征的数据;最后使用并行化后的协同过滤推荐算法得到推荐结果.本文采用豆瓣读书网站上的真实图书评论数据进行实验验证,实验结果表明,分布式环境下的协同过滤推荐算法与朴素贝叶斯算法能够高效结合,显著提高推荐效率,准确度也有所提升.  相似文献   

17.
针对传统的索引和过滤算法处理在线相似连接时的不足,提出新的索引方法和过滤算法.在采用倒排索引的基础上,将索引按照位置和长度的相关信息进行划分,以减少查询空间,加强倒排索引的执行效率.此外,设计加权签名过滤算法,用来估计2个集合交的长度的上限,提高过滤的效率.集合的相似连接通常应用于过滤 验证的工作框架里,主要采用2个步骤:先产生候选结果集合;再对候选集合进行验证.通过对真实数据集的实验,结果表明,该过滤算法可以和其他过滤算法一起协同应用于过滤 验证的工作框架里,对数据进行在线相似连接处理,同时在计算效率上也有显著的提升.  相似文献   

18.
对RFID中间件的架构进行了介绍,研究和分析了现有的数据过滤方法.结合应用场景的实际需求,设计了一种具有广泛适用性,能够抑制噪点数据和去除冗余数据的过滤算法.该算法对重复出现的标签进行权值累加,对未出现标签进行权值递减,当某标签权值达到预设阀值时则触发相应的标签事件,以减少噪点和冗余数据引起事件误报的可能性.最后,使用java语言对该算法进行了实现,并通过2个模拟场景的实验,对该算法的有效性和适应性进行了验证.  相似文献   

19.
提出了一种基于相对熵和子空间二次过滤的CLIQUE改进算法。该算法根据数据的分布情况对每一维采用自适应的网格划分方法,减少了全空间中网格单元的数量,降低了算法的时间复杂度。算法采用了基于维关联度的子空间二次过滤策略,提高了聚类结果的准确性。实验使用仿真数据表明,该算法在精度,时间复杂性等方面的表现优越。  相似文献   

20.
为解决核模糊相似性度量谱聚类算法的样本点降噪问题,优化聚类效果和稳定性,本文从分析异常点分布特性出发,引入局部异常因子(LOF)算法,提出聚类中心候选对象的概念,过滤数据集的噪声数据,从而优化初始聚类中心的计算,突出正常样本点在聚类中心调整中的影响力,使聚类算法更易于得出准确的聚类结果. 同时提出一种局部过滤因子以修正相似性度量的方法,该方法通过放大正常数据之间的权值、缩小正常数据与噪声数据间的权值,使优化后的核模糊谱聚类算法大大降低对异常点的敏感度. 算法有效性实验和算法稳定性实验表明:该方法对相似性度量修正的有效性使核模糊谱聚类算法更为稳定和鲁棒.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号