首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
孙飞  谢旭升 《电子世界》2014,(17):17-18
本文是基于瑶湖论坛的关键字搜索应用,在进行文本的选择与分词、关键字权重的计算、文本向量空间模型的表示和帖子分类算法的选择上都充分考虑了论坛的性质,并且在分词时增加了人工干预的形式,使得更好的满足论坛的需要。  相似文献   

2.
通过对Solr全文检索框架及其词频统计组件的原理和相关技术的介绍,结合消防业务部门在灭火救援及防火监督方面的热词分析及预警需求,对Solr词频统计算法进行改进。通过利用消防各类业务系统的相关数据建立索引,以Solr全文检索框架及改进后的词频统计算法为基础,设计一套面向消防业务的高效热词分析系统,并阐述在该领域内的研究应用成果。通过本系统的应用,可以为消防部门在主动发现当前热点警情和预测预警业务上提供数据支撑。  相似文献   

3.
主题搜索是搜索引擎发展的一个新方向。Lucene是目前优秀的搜索引擎开源软件之一。文章以BBS搜索引擎为载体,研究了面向主题搜索引擎的实现和优化,提出了JE中文分词实现方法,针对BBS文本结构特性,改进和优化了Lucene检索评分算法,构建了一套高性能的主题搜索引擎实验系统。通过对水木清华等BBS信息的采集和测试,证明了该主题搜索引擎的性能和效率得到较大改进和提高。  相似文献   

4.
俸世洲 《电子测试》2016,(19):91-92
本文主要研究高校招生领域Web短文本的表示方法及处理步骤.基于自编码神经网络对输入数据的要求,研究文本预处理的主要技术:中文分词、停用词处理、降维处理,文本向量化表示等技术,并分析了文本表示的处理流程.  相似文献   

5.
提出了一种基于类的混合概率分类方法.该方法为每一类文本独立选取能代表其本质特性的主要特征,即不同类型的文本由不同的主要特征表示,并基于各类的主要特征分别为每类文本建立相应的概率分布模型,然后再根据朴素贝叶斯方法对未知类型的文本进行分类.实验结果表明:该方法简单有效且易于实现.  相似文献   

6.
为了解决面向话题的搜索问题,提出一种新的面向话题的检索技术。首先分析了面向话题的搜索技术所面临的问题,然后基于数据挖掘技术提出了解决方案。利用数据挖掘技术抽取文本的多层次语义特征,形成对文本的多精度表示,抽取的特征不仅包括单个词特征也包括多词特征。建立了一个示例检索系统,实验表明利用多层次文本特征能够很好地实现面向话题的文本检索。  相似文献   

7.
《现代电子技术》2021,(1):58-63
针对传统ORB算法匹配效率低、误匹配率高的问题,提出一种基于局部相似性的特征匹配筛选算法。对传统的非极大值抑制算法进行优化,优化后算法在效率上有明显的提升并且可以保留更多能准确匹配的特征像素点,从源头减少了误匹配的产生。针对传统RANSAC筛选算法迭代慢、对视角变化图像的鲁棒性不足的缺陷,提出一种基于局部相似性的筛选算法,通过特征像素点局部范围内其他特征像素点的相似分布进行筛选。实验结果表明,提出的筛选算法具有更高的效率,同时对视角变化的图像鲁棒性更强。  相似文献   

8.
如何从海量评论文本中提出关键、有价值的文本数据为用户所用成为当前研究的重点。笔者主要针对国内评论挖掘技术系统尚未成熟问题,拟研究一个基于句法依存结构方法的特征评论挖掘方法,用于支持高效地聚类分析句子倾向性,得出有较好价值参考的评论数据信息。  相似文献   

9.
中文分词是自然语言处理中一项重要的基础任务。由于中文词汇存在多义词、同音字等特殊性,能够准确地完成分词任务是近年来中文分词研究面临的挑战之一。因此,本文提出了一种融合字符特征、拼音特征、五笔输入特征的共享BiLSTM-CRF模型,通过在训练过程中共享LSTM-网络来有效地融合语言特征。经大量数据集实验表明,特征融合能显著提高标记的准确性。在没有利用任何外部词汇资源的情况下,AS和CityU数据集中准确率可分别达到96.9%和97.3%。  相似文献   

10.
在皮肤症状计算机辅助测试系统研究中,症状特征的筛选是提高系统诊断的关键问题,针对这个问题提出基于遗传算法和LVQ神经网络相结合的包裹算法。同时为了提高搜索效率,采用改进的自适应遗传算法。并用留一交叉法验证LVQ神经网络分类器的识别率.对初步提取的体现病态皮肤症状特点的22个特征以及它们的10个随意组合构成的干扰项进行特征选择,选择出使皮肤症状诊断率得到明显提高的特征组合。实验证明该方法是可行的。  相似文献   

11.
一种改进的文本特征选择算法   总被引:2,自引:0,他引:2  
在文本挖掘中,文档通常以特征向量的形式表示。为了提高文本挖掘算法的运行速度,降低占用的内存空间,过滤掉不相关或相关程度低的特征,提出一种改进的特征选择算法,该算法对特征进行综合考虑,从而更加准确地选取有效的特征。实验验证了改进算法的可行性和有效性。  相似文献   

12.
文本特征提取的正确高效直接影响聚类结果准确率,针对文本特征提取中文本数据的高维、高噪声问题,提出采用独立分量分析作为文本特征词的提取技术.采用TF-IDF方法形成文本特征的数字描述矩阵一向量空间模型,使用独立分量分析算法实现对矩阵的关键特征词提取,使用非负矩阵分解及其扩展算法对矩阵进行聚类分析,实现聚类.  相似文献   

13.
System Entropy and Its Application in Feature Selection   总被引:8,自引:3,他引:5  
1 IntroductionFeatureselection ,ideally ,istoselecttheopti malfeaturesubsetfromacandidatesettodescribethetargetconception .Peopleusuallypaymuchat tentiontofeatureselectionbecauseofitspotentialofsimplifyingthestructureofasystem ,speedinguptheprocessofruleinduction ,reducingthecostofinstanceclassificationandimprovingtheperfor manceofthelearnedresults.Theoptimalfeaturesubsetofasystemisusuallymini featurebiased ,i.e.itprefersdescribingasystemwithfeaturesasfewaspossible[1 ] .Unfortunately ,theprob…  相似文献   

14.
AMethodforHeadshoulderSegmentationandHumanFacialFeaturePositioningHuTianjianCaiDejunDepartmentofElectricalandInformationEngi...  相似文献   

15.
Opinion mining involves the analysis of customer opinions using product reviews and provides meaningful information including the polarity of the opinions. In opinion mining, feature extraction is important since the customers do not normally express their product opinions holistically but separately according to its individual features. However, previous research on feature‐based opinion mining has not had good results due to drawbacks, such as selecting a feature considering only syntactical grammar information or treating features with similar meanings as different. To solve these problems, this paper proposes an enhanced feature extraction and refinement method called FEROM that effectively extracts correct features from review data by exploiting both grammatical properties and semantic characteristics of feature words and refines the features by recognizing and merging similar ones. A series of experiments performed on actual online review data demonstrated that FEROM is highly effective at extracting and refining features for analyzing customer review data and eventually contributes to accurate and functional opinion mining.  相似文献   

16.
目标特征信息反映了目标的固有特性,可用于目标的识别。阐述了如何在雷达数据处理系统中提取出反映目标特征信息的参量,并将其应用于工程中以提高航迹处理的效果。  相似文献   

17.
随着互联网的不断普及,网络已经跟人们的日常生活密不可分,使用者在享受网络所带来的便利的同时,网络上的许多问题也陆续衍生而出,运营商网络正面临着日益严重的安全威胁.作为网络管理者,如何迅速有效地监测网络异常情况,同时准确地掌握整个网络的业务流量模型,供市场部门作决策分析,已成为一项重要的课题.介绍了利用NetFlow技术,构建网络异常监测及分析系统,利用本系统可随时监测网络运行情况,以达到网络稳定顺畅运作及节省经费、人力的目的.  相似文献   

18.
网络流量特征选择方法中的分治投票策略研究   总被引:1,自引:0,他引:1       下载免费PDF全文
特征选择作为机器学习过程中的预处理步骤,是影响分类性能的关键因素.网络流量具有数据量大,特征维度高的特点,如何快速提取特征子集,并提高分类效率对于基于机器学习的流量分类方法具有重要意义.本文提出基于分治与投票策略的特征提取方法,将数据集分裂为多个子集,分别执行特征提取算法,利用投票方法获得最后的特征子集.实验表明可有效提高特征提取的时间效率,同时使分类器取得良好的分类准确率.  相似文献   

19.
在实际工业环境下,光线昏暗、文本不规整、设备有限等因素,使得文本检测成为一项具有挑战性的任务。针对此问题,设计了一种基于双线性操作的特征向量融合模块,并联合特征增强与半卷积组成轻量级文本检测网络RGFFD(ResNet18+GhostModule+特征金字塔增强模块(feature pyramid enhancement module, FPEM)+ 特征融合模块(feature fusion module,FFM)+可微分二值化(differenttiable binarization,DB))。其中,Ghost模块内嵌特征增强模块,提升特征提取能力,双线性特征向量融合模块融合多尺度信息,添加自适应阈值分割算法提高DB模块分割能力。在实际工厂环境下,采用嵌入式设备UP2 board对货箱编号进行文本检测,RGFFD检测速度达到6.5 f/s。同时在公共数据集ICDAR2015、Total-text上检测速度分别达到39.6 f/s和49.6 f/s,在自定义数据集上准确率达到88.9%,检测速度为30.7 f/s。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号