首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
本文提出一种基于概念图和简单语义分析相结合的文本过滤技术.利用概念图知识表示方法定义文本中概念间的语义倾向关系,把文本过滤问题转换成基于概念图的语义匹配问题.在使用概念图匹配推理中,利用敏感词汇分类和词语的褒贬性,有效简化过滤的匹配处理.经实际应用表明,基于概念图的倾向性文本过滤方法可以有效的识别和过滤倾向性文本信息.  相似文献   

2.
基于知网的概念特征抽取方法   总被引:14,自引:0,他引:14  
文本特征抽取是文本过滤的一项重要基础,但通常采取的用字、词作为特征项的显著缺点是无法表达文本的语义信息,所以本文在向量空间模型的基础上提出了一种以知网为语义知识库、基于语义信息的文本特征项抽取方法。该方法比单纯的词汇信息更能体现文本的概念特征,提高过滤系统的性能;同时还能降低文本向量的维数,减少计算量,提高过滤效率。我们在引入了该方法的中文文本过滤系统上进行的实验结果也充分证实了其有效性。  相似文献   

3.
张鑫姝  郭戈  程娟 《电子技术》2010,47(4):22-24
本文提出一种视频文本语义信息分析的新思路,即在文本区域提取后结合文种识别理论来提取新闻视频的来源和身份等高级语义信息,同时文种识别结果可为OCR的选择提供先验知识。主要工作包括:1)针对视频中的字幕,提出一种基于时-空分析的算法来检测视频中的字幕,然后对检测到的字幕通过投影分析进行定位、增强和二值化;2)对提取到的文本区域提出一种基于PCA和小波变换的文种识别算法。  相似文献   

4.
为有效解决Deep Web数据库中数据纠错、消重和整合问题,优化Deep Web数据库实体查询性能.提出一种基于智能语义自相关特征的Deep Web数据库优化识别查询模型.模型由文本匹配模型、语义自相关特征分析模型和分组统计模型构成,设计语义自相关特征提取算法,定义语义信息约束规则,优化逼近数据库实体识别结果,使用语义自相关特征建立表象关联知识库,实现数据查询过程中的纠错、消重、整合.最后用数学推导证明了算法的稳定性.仿真模拟实验表明,算法能综合考虑文本特征、语义自相关特征和约束规则,数据库查询识别结果不断精化,数据查询准确性和有效完备性提高显著.  相似文献   

5.
王强  关毅  王晓龙 《电子与信息学报》2007,29(12):2885-2890
本文提出了一种基于标题类别语义识别的文本分类算法。算法利用基于类别信息的特征选择策略构造分类的特征空间,通过识别文本标题中的特征词的类别语义来预测文本的候选类别,最后在候选类别空间中用分类器执行分类操作。实验表明该算法在有效降低分类候选数目的基础上可显著提高文本分类的精度,通过对类别空间表示效率指标的验证,进一步表明该算法有效地提高了文本表示空间的性能。  相似文献   

6.
提出一种基于差异化融合的语义信息检索算法,并实现模型设计和仿真。构建语义本体模型,提取关联维差异化特征,进行特征融合,采用自顶向下和分治的方法构建差异化语义信息特征的融合模型,求得融合后的差异化语义信息特征信息增益,在语义信息检索本体模型特征空间中,计算语义信息特征,将不同文本分量元素进行初始化倾向性分类处理,基于集中度、分散度和频度构建特征空间,进行信息抽取,对分层差异化特征进行融合处理,实现语义信息检索算法改进。  相似文献   

7.
随着网络的普及,网络上的各种不良文本信息也日益增多,如何对这些不良信息进行监控和过滤成为新的研究课题。文章在相关研究基础上,提出了一种基于语义分析的概念网络构建方式,并介绍了基于此概念网络的文本过滤分析算法。  相似文献   

8.
李新 《电子工程师》2009,35(6):15-20,23
信息安全是人们关注的焦点,从传统的基于行为的安全向基于内容本身的安全不断发展,信息安全的外延在不断扩大。Internet提供的海量、庞杂的信息中,不良信息以不同的表现形式,从不同的角度对不同人群造成毒害或干扰。因此,对网络访问进行必要的、有效的内容过滤是营造健康安全网络环境的重要环节。但是,传统的文本信息过滤算法仅能实现结构对应层次上的判断,无法体现文本的语义,过滤效果难以满足智能化的要求。文中结合计算机语言学知识,提出并实现了一种语义分析的过滤方法,对于那些冗长文本中因为分散存在的关键字而造成的假匹配,通过语义分析,可以很好地甄别处理,从而提高系统的召回率。  相似文献   

9.
一种基于语义可理解的信息过滤算法   总被引:2,自引:0,他引:2  
张波  向阳  王坚 《电子与信息学报》2010,32(10):2324-2330
个性化与准确化是信息过滤技术发展面临的关键问题.语义理解技术有助于解决这一关键问题.其基本思想是对信息内容以及用户需求进行形式化语义描述,使其具备计算机可理解的形式,进而以语义为标准实现信息过滤.该文提出定义信息领域本体以描述语义,并将信息语义分为信息特征项和其解释,同时将用户需求语义分为显性需求和隐性需求.进而,给出了信息语义理解判定方法和用户需求语义理解判定方法.最后,该文提出了基于语义可理解的信息过滤算法.实验分析表明,这种信息过滤方式能够有效地提高信息获取的效率.  相似文献   

10.
基于支持向量机的电子邮件过滤技术   总被引:1,自引:0,他引:1  
有别于传统的电子邮件过滤技术,文章在垃圾邮件识别过程中引入主要针对邮件信头非文本信息的信件分类机制,进而基于支持向量机完成电子邮件信头信息过滤模型的搭建工作。实验结果表明,对应模型能够提高邮件过滤系统对于垃圾邮件的识别率,同时降低了系统对正常邮件的误判率。  相似文献   

11.
任开旭  王玉龙  刘同存  李炜 《电子学报》2019,47(9):1848-1854
协同过滤作为推荐系统核心技术,面临严重的评分数据稀疏性问题.融合物品文本信息可以有效的解决数据稀疏性问题,然而,目前的方法侧重于提取文本的单维特征,忽略了物品语义表示的多维特性.深度挖掘物品内容的多维特性可以更加精细化描述物品的语义信息,有助于提升推荐效果.为此,本文提出基于胶囊网络的概率生成模型.模型利用胶囊网络挖掘文本的多维语义特征,并以正则化方式融入概率矩阵分解框架,建立用户与物品之间的内在关系.实验结果表明本文提出的模型具有更高的评分预测精度.  相似文献   

12.
牛洪波  丁华福 《信息技术》2007,31(12):100-102
针对目前网络上不良信息变换不同方式逃脱过滤以及中文分词器分词后存在的问题,提出了基于文本分类技术的信息过滤方法,通过在原有的文本自动分类系统中添加三个过滤模块,以过滤掉无用信息、单个独立字、敏感信息等不良内容,从而保障分类安全高效。  相似文献   

13.
一种针对不良主题的文本过滤方法   总被引:1,自引:1,他引:0  
针对不良文本的过滤问题,文章提出了一种基于SVM分类器改进的文本过滤方法。该方法将传统的基于词语的分类方法改为基于词语元组的分类,增强了特征项的分辨率,实验表明该方法同传统的过滤方法相比具有较高的准确率和召回率。  相似文献   

14.
对海量数据进行聚类,从中获取有价值的隐含知识,已经成为一项迫切的需求。传统的基于词频或距离的文本聚类技术在准确度方面存在较大差距。引入文本语义信息的聚类方法,提高了聚类的准确度。实验结果表明,基于语义特征的模糊聚类算法具有较好的聚类效果。  相似文献   

15.
基于知网语义相似度计算的文本特征提取   总被引:2,自引:0,他引:2  
互联网中存在着大量的文本信息,而对于这些文本信息的监管还存在着很大的盲区,如何从互联网的大量信息中进行相关舆情分析、预测及管控足信息安全领域中的新课题,其中文本特征的有效提取是研究内容之一。文章基于知网中语义词语语义相似度的计算方法提出一套建立在之上的语句语义相似度的计算方法,并用此方法提取出文本的特征。  相似文献   

16.
伍杰 《通信技术》2013,(5):91-94
随着网络技术和应用迅猛发展,大量的不良视频图像在网上传播,极大地危害了社会的稳定和人们的身心健康,如何有效监测有害视频成为关注的重点。针对这个问题,提出了一种改进的文本安全检测方法。该检测方法首先采用基于语义倾向性分析对字幕文本进行分类,然后将分类结果与用户需求库比较并通过阈值判断是否报警,从而达到监测有害视频的目的。其中文本检测方法是通过分析上下文计算出极性词的修饰极性,并考虑到名词的影响,最后得到整篇文本的倾向性。实验结果表明,该方法能够有效的监测到有害视频。  相似文献   

17.
一种基于WordNet的短文本语义相似性算法   总被引:3,自引:0,他引:3       下载免费PDF全文
 短文本语义相似性计算在文献检索、信息抽取、文本挖掘等方面应用日益广泛.本文提出了一种短文本语义相似性计算算法ST-CW.此算法使用WordNet和Brown文集来计算文本中的概念相似性,在此基础上提出了一个新的方法综合考虑概念、句法等信息来计算短文本的语义相似性.在R&;B及Miller数据集上进行实验,实验结果验证了算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号