首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 234 毫秒
1.
将流形学习中的t-SNE算法引入仿生嗅觉领域中,本研究提出一种基于t-SNE与LDA算法相结合的气味分类鉴定新方法。由PEN3电子鼻获取物质气味特征信息,通过t-SNE算法将非线性、高维度的气味响应数据降维到低维空间,并利用LDA算法对低维数据进行分类和识别。本研究利用五种不同成分的纺织品材料气味信息,通过t-SNE、PCA LDA和t-SNE LDA三种算法作对比实验。实验结果表明,相较于其他两种方法,t-SNE LDA算法对常见的不同成分纺织品材料拥有更好的分类和识别效果,而且t-SNE LDA算法得到的结果具有较小的类内离散度和较大的类间离散度。因此,t-SNE LDA算法是仿生嗅觉中气味分类和识别的一个新方法。  相似文献   

2.
马兰  王京杰  陈焕 《计算机应用》2019,39(2):488-493
针对广域信息管理系统(SWIM)服务共享中的数据安全问题,分析了SWIM业务流程中的安全隐患,提出了一种基于潜在狄利克雷分配(LDA)主题模型和内容挖掘的恶意数据的过滤方法。首先对SWIM四种业务数据进行大数据分析,然后通过LDA模型对业务数据进行特征抽取完成内容挖掘,最后利用KMP匹配算法在主串中查找模式串,从而检测出含有恶意关键字的SWIM业务数据。在Linux内核中对该检测方法进行测试,实验结果表明该方法能够有效地对SWIM业务数据进行内容挖掘,与潜在语义分析(LSA)和基于概率统计的潜在语义分析(pLSA)的方法相比也具有更好的检测性能。  相似文献   

3.
郑世卓  崔晓燕 《软件》2014,(1):46-48
在如今信息数据大爆炸的时代,数据的增长呈现指数级增长,而且其中大部分数据是非结构化数据,这些数据中蕴藏着大量且重要的知识等待着我们用合理的办法将其挖掘出来,如何方便合理快速的进行文本分类也是一个非常重要的课题。LDA模型是一种无监督的模型,它可以发现隐性的主题,为了更有效的发现隐性主题,本文提出一种基于半监督的LDA主题模型,找到一个主题集作为隐性层的知识集,通过这种方法找到的主题与文本更相关,另外,将LDA模型与基于半监督LDA模型应用于文本的特征提取,并与其它特征提取方法比对,实验表明,半监督LDA模型性能略好。  相似文献   

4.
为了给医生及病人安全、合理、高效用药提供决策支持,提出了一种基于LDA(Latent Dirichlet Allocation)的用药分析方法 Ma LDA(Medication Analysis based on LDA)。该方法结合了用药记录和就诊记录,将药物看作文档、药物功能看作主题、疾病看作词语,通过主题模型LDA发现隐含的药物功能,通过药物功能,将相关药物、相关疾病和药物与疾病联系起来。根据药物对药物功能的分布对药物进行聚类,每一类药物被相关的疾病所描述,进而对临床用药进行分析。Ma LDA不仅能发现临床用药中针对某一类疾病效用较好的药物,而且能发现隐含的联合用药。实验数据来源于上海市某医院137 510位病人的用药记录和就诊记录。实验结果证实了Ma LDA相对于其他方法在对电子就医记录进行用药分析的有效性。  相似文献   

5.
通过优化Spark MLlib机器学习库中的隐含狄利克雷分布(LDA)主题模型,提出一种改进的学术研究热点挖掘方法。采用LDA主题模型对学术论文关键词进行建模,利用困惑度确定主题模型的最佳主题个数,并将文档-主题和主题-词概率分布矩阵转化为文档-主题和主题-词评分矩阵。通过计算背景主题与评分矩阵中各主题之间的相似度对主题进行排序,挖掘出学术论文中的研究热点。实验结果表明,该方法能提高LDA主题模型的挖掘效果,有助于发现有价值的学术研究热点主题。  相似文献   

6.
随着对LDA模型的研究越来越深入,文本表示和挖掘能力进一步提高。话题是LDA模型中一个非常重要的概念,是特征集合的一个多项式概率分布。话题追踪是根据少数已知相关信息在未知报道流中追踪一个话题,找出与该话题相关的所有报道。把LDA模型用于话题追踪,目的有两个:(一)检验LDA话题对追踪话题的表示能力;(二)检验LDA模型在挖掘训练数据中的追踪话题时,LDA话题和追踪话题之间的关系。实验表明:相对于经典的向量空间模型和一元语言模型,以及专门针对追踪话题提出的事件模型,基于LDA模型的追踪性能更好,但由于粒度不同,LDA模型中的话题和追踪话题并没有直接的一一对应的关系,实现可定制话题的LDA模型是下一步工作的目标。  相似文献   

7.
电子鼻所采集的中药材气味信息往往具有高维性和非线性。针对气味信息的这种特性,提出一种基于监督局部线性嵌入(SLLE)和线性判别分析(LDA)的气味数据分析方法。首先利用SLLE对所采集的高维非线性气味信息进行降维,目的是提取出气味数据内在的低维流行特征,并增大类别间的辨别信息。然后,在低维空间中,利用LDA进行特征分类判别。通过实验,分别将该方法与单独使用SLLE方法及PCA LDA方法进行对比分析,结果表明,该方法可以很好地对五种不同种类的中药材及三种不同产地的何首乌进行分类鉴别,其个体识别率和整体识别率均可达到100%,为使用电子鼻对中药材进行分类鉴别提供了一种行之有效的方法。  相似文献   

8.
针对大规模数据分类时计算时间长以及分类精度下降等问题,提出使用张量分解求解LDA主题模型参数,实现对海量网络数据的采集、分类、挖掘.该方法使用矩量法将LDA模型求解转化为低维的张量分解问题,通过分解和反射进行参数的传递,运用大数据平台Spark的进行分布式计算.实验结果表明,改进的模型参数计算方法在时间效率和困惑度方面都得到了提升,并且分类信息更加直观,更加适用于大规模网络数据分类工作.  相似文献   

9.
基于LDA主题模型的文本相似度计算   总被引:1,自引:0,他引:1  
王振振  何明  杜永萍 《计算机科学》2013,40(12):229-232
LDA(Latent Dirichlet Allocation)模型是近年来提出的一种具有文本表示能力的非监督学习模型。提出了一种基于LDA主题模型的文本相似度计算方法,该方法利用LDA为语料库建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,挖掘隐藏在文本内的不同主题与词之间的关系,得到文本的主题分布,并以此分布来计算文本之间的相似度,最后对文本相似度矩阵进行聚类实验来评估聚类效果。实验结果表明,该方法能够明显提高文本相似度计算的准确率和文本聚类效果。  相似文献   

10.
为了解决传统的文本主题模型对微博主题挖掘准确率低及不考虑主题之间关联的问题,针对中文微博语料本身的特点,分析LDA和HMM模型优缺点,提出了微博主题挖掘模型MB-HL(Microblog-Hidden Markov Model Latent Dirichlet Allocation)。该模型用逐条微博作为处理单元,建立分布主题-词语矩阵并进行优化,通过LDA模型对微博用户不同的行为建模并提取特征,利用HMM模型强大的时序状态建模能力弥补LDA在主题相关性上的不足,采用Gibbs采样进行推理求解。在真实的新浪微博数据上对比实验表明MB-HL模型能提高近9%主题关键词的准确度,并能有效地发现主题之间的关联关系。  相似文献   

11.
目前生物嗅觉系统在气味识别方面相比于化学传感器阵列构成的电子鼻系统具有更高的灵敏度、特异性和响应速度。为了探讨生物嗅觉传感系统气味识别的可行性,构建了基于微电极阵列传感器植入大鼠嗅球构成的嗅觉传感系统,研究记录了浓度为10 mM的异丁醇、苯甲醚、香芹酮和柠檬醛4种气味刺激引起的嗅球僧帽层低频场电位信号,采用多窗谱估计算法和移动窗技术结合得到随时间分布的功率谱密度图。实验结果发现气味刺激后信号功率谱能量较多分布在gamma频段(40 Hz~120 Hz)。使用K最邻近分类方法对120组数据进行分类识别,4种气味分类正确率达到77.4%。实验结果表明该嗅觉传感系统结合多窗谱估计时频图与K最邻近分类算法可以初步实现气味识别。  相似文献   

12.
针对葡萄酒品质预测模型难以建立的问题,提出一种基于模糊递归小波神经网络的葡萄酒品质预测模型。利用葡萄酒物理化学指标和品酒师打分作为模型的输入输出,采用梯度下降算法在线学习隶属函数层中心、宽度和小波函数平移因子、伸缩因子、自反馈权重因子以及输出层权值。仿真实验时,首先利用Mackey-Glass混沌时间序列进行了性能测试,然后利用UCI数据集葡萄酒品质数据对所建立的品质预测模型进行了验证。结果显示,与多层感知器、径向基函数神经网络等传统前馈神经网络相比,构建的模糊递归小波神经网络品质预测模型具有更高的预测精度,更加适合于葡萄酒的品质预测。  相似文献   

13.
摘 要: 为了从日益丰富的蒙古文信息中快速准确地检索用户需求的主题信息,提出了一种融合主题模型LDA与语言模型的方法。该方法首先对蒙古文文本建立一元和二元语言模型,得到文本的语言概率分布;然后基于LDA建立主题模型,利用吉普斯抽样方法计算模型的参数,挖掘得到文档隐含的主题概率分布;最后,计算出文档主题分布与语言分布的线性组合概率分布,以此分布来计算文档主题与查询关键词之间的相似度,返回与查询关键词主题最相关的文档。语言模型充分利用蒙古文语法特征,而主题模型LDA又具有良好的潜在语义挖掘及主题发现的泛化学习能力,从而结合两种方法更好的实现蒙古文文档的主题语义检索,提高检索准确性。实验结果表明,融合LDA模型与语言模型的方法相比单一模型体现主题语义方面取得了较好的效果。  相似文献   

14.
It is shown that data pre-processing by rank-order filtering can significantly improve the odor discrimination capability of an array of chemical sensors, while simultaneously reducing the amount of data to be processed. This work is a first example in feature extraction from tin-oxide sensors that both reduces the size of the data set and simultaneously improves the discrimination performance of the array. This work is aimed toward the design of remote sensor modules where bandwidth reduction and improved accuracy are both essential to system performance. The effectiveness of extracting rank from a 30-element array of tin-oxide sensors is presented. Results are extrapolated to other arrays of chemical sensors whose specificities and response characteristics overlap. Methods for processing data and extracting rank-related features from arrays of tin-oxide sensors are comparatively analyzed. Processing parameters studied include those related to temporal filtering and window-averaging, pre-scaling (to remove baseline), sample acquisition time, and the number of ranks used in rank-order filtering of the data during the transient and steady state response. Cluster analysis, including principal component analysis (PCA) and a novel method described herein, is used to determine which of these processing techniques are most effective. Artificial neural networks, specifically multi-layer perceptrons and radial basis function networks, are used to further investigate the ability to discriminate odors on the basis of the extracted features.The analysis is performed for an array of 30 tin-oxide sensors applied to detecting a sampling of breath alcohol mixtures (beer, wine, vodka) and common interferents (acetone, formaldehyde, isopropyl). Ammonia is included as a contrast substance. For the set of seven odorants studied, it is found that using rank-order filtering with 10 or more ranks improves odor recognition rate by a multi-layer perceptron neural network from 92% to 95%. If one odor (vodka) is removed from the study set, the recognition rate for the remaining odors improves from 95% (with no rank-order filtering) to 99%. Simultaneously, the dimensions of the data set for each odor are reduced from 30 sensors×18,000 time steps (12 bit samples) to N integer values, where N is the number of ranks used in the rank-order filtering.  相似文献   

15.
嗅觉系统是生物感觉神经系统中非常重要的组成部分。当嗅觉感受器接收到气味刺激时,其将化学信号转换为电信号并传递给嗅球,嗅球对信息进行整合与编码,继而将其传递到大脑嗅皮层,最终产生嗅觉。对于嗅觉神经网络的建模以及嗅觉信息处理的研究有助于理解嗅觉系统是如何有效区分不同种类与浓度的气味。本文在由僧帽细胞、颗粒细胞以及球旁细胞所构成的传统嗅球模型基础上,引人了嗅皮层来构建完整的嗅觉网络模型,并考虑了抑制性突触可塑性在网络接受刺激时的学习作用。其仿真结果表明抑制性突触可塑性可以平衡嗅皮层中兴奋性和抑制性的突触电流,从而使得嗅皮层对于气味刺激表现为特定的发放模式。嗅皮层对于不同种类的气味刺激表现为不同的发放模式,而对于同一种类不同浓度的气味刺激表现为相似的发放模式与不同程度的发放强度。同时提出了基于核方法的层次聚类和模糊聚类算法来实现对不同种类纯气味的识别和对混合气味中各种气味成分的识别。  相似文献   

16.
随着微博的日趋流行,新浪微博已成为公众获取和传播信息的重要平台之一,针对微博数据的话题挖掘也成为当前的研究热点。提出一个面向大规模微博数据的话题挖掘方法。首先对大规模微博数据进行分析,基于Bloom Filter算法对数据进行去重处理,针对微博的特有结构,对文本进行预处理,提出改进的LDA主题模型Social Network LDA(SNLDA),采用吉布斯采样法进行模型推导,挖掘出微博话题。实验结果表明,方法能有效地从大规模微博数据中挖掘出话题信息。  相似文献   

17.
为了实现结合生物工程的仿生嗅觉传感器系统的多气味检测和目标气味的特异性识别和区分,使用生物工程化的大鼠嗅觉系统作为敏感元件,植入嗅球的多通道微丝电极作为换能器,采用无线数据采集系统收集和分析响应信号。最后,利用Matlab计算神经元平均放电率,对神经元的气味响应进行相关性分析和主成分分析,证实了该系统检测和区分不同气味的性能。创新性地提出将嗅觉受体基因整合、克隆到在体嗅觉细胞上,用于改造生物嗅觉系统,使之可以对目标气味分子产生敏感的响应信号。结果表明结合基因工程的生物电子鼻系统能够显著增强其检测特异性目标气味的性能,在环境监测、公共安全等领域中有很大应用潜力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号