首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 765 毫秒

1.  突发公共事件网络在线评论序列的特征分析*  被引次数:1
   李斌  彭勤科  张晨《计算机应用研究》,2008年第25卷第9期
   针对网络评论这种新型文本的特点,给出了一组描述网络评论序列特征的指标,提出了一种基于网络评论倾向性的网络评论序列特征分析方法,并结合实例对网络评论序列的特征、网络新闻与其评论序列的关系,特别是谣言对评论序列的影响进行了分析。    

2.  基于投票机制的文本主客观分类系统研究  
   周志杰  刘功申《微型电脑应用》,2015年第2期
   网络评论的情感倾向性分析是当下热门的研究方向,其第一步就需要有效识别文本中的主观性信息。提出并分别实现了基于主客观线索的方法、基于NPOS的方法和基于条件随机场的方法来提取主观句子,最后,采用投票机制,按照少数服从多数的原则判断句子主客观性,实验结果显示,该系统显著提高了主观查全率、查准率和F-度量,有广阔的应用前景。    

3.  基于用户行为及文本内容的垃圾评论识别研究  
   胡龙茂《重庆科技学院学报(自然科学版)》,2017年第19卷第5期
   从海量的在线评论中自动识别出垃圾评论,是消费者及厂家有效利用在线评论的前提.结合垃圾评论者的行为特征及评论文本内容,采用支持向量机构建了垃圾评论识别模型.实验结果表明,该方法有效地识别了垃圾评论.    

4.  面向话题的新闻评论的情感特征选取  被引次数:2
   陶富民  高军  王腾蛟  周凯《中文信息学报》,2010年第24卷第3期
   情感特征的提取是进行文本情感分析的一个非常重要的步骤,也是影响其结果好坏的主要因素。在该文中,作者提出一种新的特征提取方法来解决新闻评论的情感分析问题。在该方法中,首先根据评论和新闻的对比分析获得候选情感特征,然后经过相关的扩充和验证操作得到通用的情感特征,并将其用于新闻评论的情感分析。对新闻进行话题划分后进行更细粒度的情感分析:根据新闻话题信息,设计相应的话题相关的特征对比和验证过程,选取出面向话题的情感特征,最后用面向话题的情感特征对相应话题进行情感分析。实验证明,这种情感特征提取方法,对于新闻评论这种语句短、评论对象相对分散的评论,情感分析效果有较大的改进。    

5.  面向文本情感聚类的维度判别方法  
   李欣  王素格  李德玉《计算机工程与应用》,2015年第7期
   在文本情感分析时,使用有监督的机器学习方法的不足是需要大量的带标签的文本数据,而无监督的文本聚类方法可以克服这一问题。对于文本情感聚类,在节省数据资源的同时,也存在聚类结果的不确定性问题。给出了情感维度的形式化描述,并将观点词识别技术应用于情感维度的判别中。在此基础上,利用获得的情感维度,对评论文本进行情感聚类,有效地解决情感聚类结果的不确定性问题。在4个领域的英文产品评论数据上进行实验,结果表明该方法在自动识别情感聚类维度中是有效的,并得到了满意的情感聚类结果。    

6.  基于LDA模型的博客垃圾评论发现  被引次数:1
   刁宇峰  杨亮  林鸿飞《中文信息学报》,2011年第25卷第1期
   Blog(博客)作为一种新兴的网络媒体,在很大程度上增强了互联网的开放性,Blog已经成为互联网上的主要信息源之一,这也使得Blog空间中的垃圾评论成倍增长,因此如何识别垃圾评论成为面临的重要问题。该文首先借鉴处理垃圾邮件的方法,针对Blog本身的特点,使用规则初步过滤垃圾评论,然后对剩余评论,利用Latent Dirichlet Allocation(LDA)这种能够提取文本隐含主题的产生式模型,对博客中的博文进行主题提取,并结合主题信息进行判断,从而识别Blog空间的垃圾评论。通过实验验证,该方法可以发现大多数垃圾评论,实验取得了较好的结果,使Blog信息更加准确、有效的为用户使用。    

7.  电视新闻文稿中的人物对象探究  
   台正  冉悦  刘雁翎《西部广播电视》,2014年第10期
   人物关系分析技术可以应用于新闻话题的检测与追踪、新闻人物的社会关系分析,可以为广播电视新闻节目的策划、分析、制作等提供深层背景材料.笔者以重庆广播电视集团的部分电视新闻文稿数据为数据源,采用自然语言处理技术和数据挖掘技术,对新闻文稿数据中的新闻人物对象进行实体识别与关系抽取,并结合社交网络模型对新闻人物对象间的关系进行分析.    

8.  面向微博文本的命名实体识别  
   姜仁会      唐晋韬《计算机与数字工程》,2014年第4期
   命名实体识别是文本信息处理的重要基础,也是自然语言处理的一项关键技术.近几年来微博迅速发展成为人们进行信息交流的平台,微博文本俨然已经成为进行命名实体抽取的新载体.论文利用微博内容和结构的特点,提出了一种基于统计与规则相结合的命名实体识别的方法.微博文本较短并且文本中含有标签、话题等内容,论文在考虑这些特点基础上,利用微博评论和转发进行词频统计,通过规则筛选,完成命名实体识别.在新浪微博数据上的实验结果表明该方法可以有效地提高微博中命名实体识别效果.    

9.  Web文档评价对象抽取研究  
   许细清  林世平《计算机工程》,2011年第37卷第6期
   针对用户评论信息,基于句子上下文相关线索和上下文无关线索信息,应用句法分析、点互信息方法,构造领域词典及主张词典,对产品评论中的评价对象进行抽取。实验结果说明,与取距离评价词最近的词作为评价对象的Baseline方法相比,该方法能提高准确率和F度量值。    

10.  口语对话中冗余词汇识别方法研究  
   翟飞飞  宗成庆《中文信息学报》,2011年第25卷第3期
   冗余现象是口语对话中普遍存在的特殊语言现象之一,它的存在常常会影响口语句子的理解和翻译.该文基于真实口语对话语料对冗余现象进行了分析,并在词汇层面对冗余现象进行了分类,然后对口语中的冗余词汇进行了统计识别方法研究.通过对冗余词汇处理前后的口语句子翻译实验,结果表明,预先对冗余现象进行处理,能够改善口语翻译的译文质量.    

11.  中文产品评论中评价对象的识别研究  被引次数:1
   徐叶强  朱艳辉  王文华  杜锐  鲁琳  邓程  刘洪婧《计算机工程》,2012年第38卷第20期
   在中文产品评论中利用无监督的识别评价对象,准确率和召回率较低。为此,提出一种中文产品评论中的评价对象识别方法。对特殊词、评价对象非完整性、评价对象非稳定性等情况过滤噪声,利用评价对象在评论文本中与评价短语规则出现频率较高的特征,进行置信度排序。实验结果表明,对于14 799篇数码类评论文章,该方法的准确率、召回率和F值分别为0.605、0.780、0.681。    

12.  一种新闻评论情感词典的构建方法  
   周咏梅  阳爱民  杨佳能《计算机科学》,2014年第41卷第8期
   情感词典研究是文本情感分析领域的一个重要内容;基于情感词典的文本情感分析方法是一种非常有效的方法。互联网上的新闻评论包含评论人的情感,对其情感进行自动分析研究是非常有意义的。借鉴图排序模型的原理,提出一种新闻评论情感词典构建方法,该方法首先通过新闻评论语料和基础情感词典获得评论情感词集和种子词,然后根据提出的基于PageRank算法的方法判定评论情感词集的极性并计算其强度,进而构建新闻评论情感词典。实验从情感词判定的准确性和基于构建的情感词典的分类性能两个方面验证了所提方法的有效性。    

13.  大数据时代中文文本褒贬倾向性分类研究  
   曾凡锋  朱万山  王景中《信息网络安全》,2014年第11期
   在当前的大数据时代,互联网上的博客、论坛产生了海量的主观性评论信息,这些评论信息表达了人们的各种情感色彩和情感倾向性。如果仅仅用人工的方法来对网络上海量的评论信息进行分类和处理实在是太难了,那么,如何高效地挖掘出网络上大量的具有褒贬倾向性观点的信息就成为目前亟待解决的问题,中文文本褒贬倾向性分类技术研究正是解决这一问题的一个方法。文章介绍了常用的文本特征选择算法,分析了文档频率和互信息算法的不足,通过对两个算法的对比和研究,结合文本特征与文本类型的相关度和文本褒贬特征的出现概率,提出了改进的文本特征选择算法(MIDF)。实验结果表明,MIDF算法对文本褒贬倾向性分类是有效的。    

14.  基于LDA模型的餐馆评论排序  
   吕韶华  杨亮  林鸿飞《计算机工程》,2011年第37卷第19期
   在餐馆评论中,存在评论文本未明确指出评价等级及评论文本不一致等问题。为此,提出一种基于LDA模型的餐馆评论排序方法。利用LDA模型对评论文本进行主题抽取,过滤掉不相关评论,基于过滤后的用户评论和用户给出的评论等级计算餐馆评论若干方面的得分,在该得分的基础上,利用逻辑回归进行训练,得到餐馆评论排序模型。实验结果表明,该方法的排序效果较优。    

15.  多特征融合的英语口语考试自动评分系统的研究  被引次数:1
   李艳玲  颜永红《电子与信息学报》,2012年第9期
   该文主要针对大规模英语口语考试自动评分系统的问答题型,采用多特征融合的方法进行评分。以语音识别文本作为研究对象,提取了3类特征进行评分。这3类特征分别是:相似度特征、句法特征和语音特征。总共9个特征从不同方面描述了考生回答与专家评分之间的关系。在相似度特征中,改进了Manhattan距离作为相似度。同时提出了基于编辑距离的关键词覆盖率的特征,充分考虑了识别文本中存在的单词变异现象,为给考生一个客观公平的分数提供依据。所有提取的特征利用多元线性回归模型进行融合,得到机器评分。实验结果表明,提取的特征对机器评分是十分有效的,并且在以考生为单位的系统评分性能达到了专家评分性能的98.4%。    

16.  基于视频、音频和文本的视频分段  
   朱映映  周洞汝《计算机工程与应用》,2001年第37卷第3期
   在分析应用视频数据的过程中,视频分段是分析、组织,应用视频数据的基础。由于视频数据的多样性、传统的分段方法不能给出令人满意的结果,一般需要通过人机交互来进行。文中将较为成熟的文本分析、语音处理、图像处理三种技术进行综合、互为补充,对视频流进行分割。文本分析的对象是语音转换成的文本、标题、注释等。语音处理包括语音识别和语音信号分析。语音识别将视频中的自然语言转换为文字。语音信号分析对视频材料中的语音成分进行基础分析。图像处理主要用来处理视频中的图像部分。文章阐述了视频流的分段层次,文本分析,语音处理算法以及镜头突变,镜头渐变识别算法的思想。    

17.  一种基于多义词向量表示的词义消歧方法  
   郭鸿奇  赵莹地  李国佳《智能计算机与应用》,2018年第4期
   词义消歧是自然语言处理领域的基本任务.在词语词向量表示的基础上,计算获得多义词语上下文窗口的向量表示.利用统计的多义词及词义个数,基于K-means算法聚类文本语料集中多义词的上下文窗口表示,在原始文本语料集中对多义词语根据聚类类别进行标记.在标记的文本语料集上,训练获得多义词语每个词义的向量表示.对句子中的多义词语,给出了一种基于多义词向量表示的词义消歧方法,实验结果显示该方法有效可行.    

18.  面向特定领域的产品评价对象自动识别研究  被引次数:2
   宋晓雷  王素格  李红霞《中文信息学报》,2010年第24卷第1期
   产品评价对象的自动识别是文本观点信息抽取和倾向性分析中的重要研究课题之一。该文针对汽车评论,提出了一种不依赖外部资源的无指导评价对象自动识别方法。该方法首先综合使用词形模板和词性模板,采用模糊匹配方法和剪枝法抽取候选评价对象。然后,从候选对象集中,采用双向Bootstrapping方法识别出产品评价对象。最后,通过采用K均值聚类方法对产品评价对象进行聚类,实现从评价对象中自动抽取产品名称和产品属性。实验结果表明,该方法对产品评价对象识别的F值达到58.5%,产品名称识别的F值达到69.48%。    

19.  基于联合法选取特征的产品评论情感分类研究  
   张静  周佐《工业仪表与自动化装置》,2018年第1期
   随着互联网中信息资源不断膨胀,如何从海量的产品评论文本信息中获得对某一产品真实的、客观的评价,已成为一个亟待解决的问题。针对传统特征量选择方法的不足,该文采用了联合特征选取的方法,并构建了基于支持向量机的分类器,有效地实现了对产品评论文本情感倾向性的分类。对网络中获取的大量评论信息进行分析和研究,结果表明,提出的方法有效地克服了低频词中噪音词的干扰,提高了文本表示质量,改善了分类的效果。    

20.  基于轮廓投影方法的文本图象偏斜纠正  
   李存华《中国图象图形学报》,2001年第6卷第10期
   印刷文献信息采集处理是文本信息处理应用,特别是数字化图书馆建设中十分繁重而又必须从事的工作。由于目前广泛使用的字符光学识别系统(OCR)无法对具有偏斜角度的扫描文本图象进行自动加工处理,所以需要大量的人工介入,即以手工方法纠正图象偏斜。因为无法有效地进行扫描文本集的批量处理,所以难以提高处理效率。针对这一问题,在讨论文本图象轮廓投影性质的基础上,利用其相关系数与文本偏斜角的统计依赖关系,构造了一个用于文本图象的自动偏斜纠正方法。    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号