首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
传统文献计量方法容易忽略文献中的文本词频,导致分析结果不能更好地突显相关领域的核心主题和研究热点,提出一种基于文本挖掘与知识图谱相结合的文献计量方法。通过共词分析构建主题词矩阵,利用共现分析、文本聚类、数据可视化和文献计量等方法分析文献核心主题和研究热点,为后续学者的研究提供参考。以高等教育改革文献为例,通过研究表明,文本挖掘和知识图谱相结合的文献计量方法可以得到高等教育改革领域的核心主题和研究热点,为高等教育改革的后续研究提供数据支撑。  相似文献   

2.
为探究生物多样性研究领域中数字技术发展进程及数字技术应用热点演变规律,运用文献计量学可视化研究工具CiteSpace对从Web of Science获得的相关数据进行主题词共现、聚类、时区图等分析,梳理出在生物多样性研究领域,数字技术的应用研究呈现出从生态及生物信息数据的数字化建档,逐步发展为生境分析模型与预测模型建立及以对生物多样性智能决策数字技术研究的发展趋势,并提出相应的数字技术应用发展建议,为生物多样性领域的数字化赋能创新发展提出启示及建议。  相似文献   

3.
以2011-2020年中国知网数据库收录的与雾霾研究相关的2025篇中文核心文献为样本,运用文献计量分析和数据可视化方法,绘制出雾霾研究领域的关键词共现图谱和聚类共现分析图、突现关键词变化时区分析图,探讨该领域的研究现状、热点及发展趋势,分析得出雾霾污染、雾霾治理、PM2. 5等成为近年来雾霾研究的热点。未来关于雾霾的研究将致力于利用大数据、智能设备参与到雾霾预防治理当中,学者们应更多地尝试跨学科合作研究,进一步推进雾霾研究。  相似文献   

4.
基于co-ICIB联合聚类的舆情监测系统的设计为舆情信息库,它通过联合聚类等数据挖掘算法可以快速及时地发现新的舆论热点.当舆论热点被确认,即在互联网上真正成为一个备受关注的话题时,文本分类算法可以将同一话题内的信息归类,有助于跟踪舆情的发展趋势.该舆情监测系统可为舆情监管部门提供原始舆情资料、数据性图表和建议性分析.  相似文献   

5.
介绍了国外可视化数据记录抽取、用户浏览突发语义学研究、性能自动评估、查询结果缓存、多代理动态在线信息挖掘技术、软计算、提问日志上下文信息分析、聚类检索查询处理效率等有关搜索引擎智能技术研究动态,试为相关研究提供信息。  相似文献   

6.
通过自然语言处理技术,实现对商品评论数据的可视化流程分析,利用八爪鱼采集器对京东商品评论数据进行采集,对文本数据进行去重、分词、去停词等预处理,再结合TF-IDF算法来提取文本数据特征词,利用R软件建立LDA主题模型并提取主题,使用LDAvis可视化工具对主题模型进行交互式可视化分析,并结合词云图将评论文本数据以更直观的方式展现出来,从而挖掘消费者重点关注的评论词语,结合主题模型和词云图两种可视化方法将用户评论情感数据通过丰富的图形进行内容展示,可以使情感分析的结果更准确、更全面反映产品和客户需求,为消费者的购买和商家的改进提供依据。  相似文献   

7.
随着文本数据的快速积累,文本自动分析成为管理和利用海量文本数据的重要手段。其中,文本聚类是文本分析的基本任务之一。本文着重介绍文本分析与谱聚类的研究进展,阐述目前在文本分析中应用谱聚类技术的主要方法,旨在为文本分析中谱聚类方法的应用提供引导作用。  相似文献   

8.
文本生成是人工智能和自然语言处理的重要研究领域,为人工智能生成内容的快速发展提供了关键技术支撑。该任务基于自然语言处理、机器学习和深度学习等技术,通过训练模型学习语言规则,自动生成符合语法和语义要求的文本。本文对文本生成的主要研究进展进行梳理和系统性总结,对近几年文本生成相关文献进行综合调研,并详细介绍相关技术模型。此外,针对典型文本生成应用系统进行介绍。最后,对人工智能文本生成的挑战和未来研究方向进行分析和展望。得出以下结论,提高生成文本的质量、数量、交互性和适应性有助于从根本上推动人工智能文本生成的发展。  相似文献   

9.
针对互联网热点信息发现的需求,提出一种基于先分类再聚类的互联网信息热点发现及分析系统构建方法.通过对互联网样本信息文本的特征提取,构建文本向量空间模型,使用Maxent最大熵分类模型对文本进行分类,对分类结果使用OPTICS聚类算法获取文本热点簇,最终获取有效热点信息.实验证明,通过先分类再聚类的方法可以有效避免语义类别不同但字面意义混淆的文章对聚类算法的影响,有效提高聚类结果的精度和运算效率.  相似文献   

10.
近年来,随着自然语言处理技术的发展,聚类技术在文本处理领域中的作用愈发凸显。目前,国内多视图文本聚类的相关研究进展仍处于起步阶段,通常运用的聚类方法是基于文本的单一领域来展现特定方面的聚类情况,但越来越多的文本聚类研究从单视图向多视图的方向转变。提出了一种以LDA主题模型和TF-WIDF特征提取算法作为特征向量组,基于谱聚类的改进型多视图半监督文本聚类方法。该方法基于半监督的协同训练(Co-training)算法,通过对协同训练算法中的文本标记方式进行改进,实现无监督性质的多视图协同训练算法。实验结果表明:改进算法相较于传统单视图文本聚类算法,很大程度上避免了单视图算法的偶然性和局限性,提高了文章整体聚类的准确度。  相似文献   

11.
为了全面、直观地分析智能停车研究领域的现状、趋势及热点问题,提高车位利用率,方便人们日常出行,缓解城市交通压力,在中国知网数据库中对2003~2022年之间的智能停车研究文献进行检索。从发文量、机构、作者、关键词4个维度利用CiteSpace软件构建智能停车研究知识图谱,从智能停车技术、智能停车方式、停车管理等3个方面重点分析智能停车研究的趋势和热点问题。研究结果表明:(1)从2012年开始,文章发表数量快速增长,智能停车领域的研究成果一直处于上升趋势;(2)根据关键词聚类分析,文献三大类为城市交通、停车位、交通工程;(3)围绕城市交通的停车管理热点为停车治理政策,围绕停车位的停车方式热点为共享停车、立体车库,围绕交通工程的智能停车技术热点为物联网、大数据。  相似文献   

12.
为洞悉我国公路工程领域地理信息系统(Geographic Information System,GIS)应用研究的现状及热点,以2010—2020年中国知网(CNKI)数据库中的相关文献为数据源,综合运用COOC、GIGO、SPSS与UCINET等软件,通过聚类树状图分析、因子分析与多维尺度分析对公路工程领域GIS研究的高频关键词进行研究主题归类;采用社会网络分析法对公路工程领域GIS研究的关键词进行共现网络图谱绘制与中心性分析,以直观揭示其研究热点与结构. 研究结果表明:公路工程领域GIS研究的热点关键词为路线设计、边坡地质灾害易发性评价、滑坡监测和路面管理系统等;研究主题主要可分为GIS多样化研究及应用、公路交通网与地质灾害评价、公路管理信息化与可视化3大类.  相似文献   

13.
随着网络技术的发展,文本信息急速增长。文本内容自动处理的相关研究无疑成为最急迫的任务。文章从一些文本内容相关的应用研究开始介绍,其中简要介绍了自动摘要技术、自动标引、信息抽取、文本分类和聚类等,期冀通过对这些应用研究的了解,认识到要重视文本内容的基础研究,从词语层到篇章层的深入分析才是文本内容处理研究发展的最终突破点。  相似文献   

14.
网络的匿名性、开放性、平等性、交互性等特点不可避免地会出现一些不和谐“杂音”,人们怎样才能吸取精华、去其糟粕,已经成为网络信息安全迫切需要解决的问题.针对传统的文本特征抽取方法,在应用于敏感信息过滤时出现的时间滞后、准确性低、自适应性差等问题,以网络舆论观点文本为研究对象,结合敏感信息特性,提出融合意见挖据和自然语言处理技术的敏感信息动态特征抽取方法,实验表明,本方法对敏感信息过滤有明显优势,实现了字典的动态维护.  相似文献   

15.
为了使个性化虚拟人更加形象生动,能根据用户输入的文本做出表情动作,运用自然语言处理技术对中文和英文文本进行语义和分类处理,分析出动作和情感信息。采用潜在语义方法从文本中提取出动作语义信息,利用hownet计算词汇相似度,使用K最近邻方法将文本情感信息分为6类:愤怒、厌恶、恐惧、喜悦、悲伤和惊讶。实验结果为:语料文本分类准确率为87.5%,系统能从用户输入的文本中提取出情感、动作信息,使虚拟人做出相应表情变化。  相似文献   

16.
针对2016年以后的互联网里国内外公开的专利情报领域信息,从专利情报信息的研究方法、研究应用和新技术应用趋势的预测3个方面对专利情报挖掘领域的研究的最新进展进行了论述.对以复杂网络为基础和以时间为基础的方法等方面展开探讨.对于当前的研究缺陷分析从没有充足的实验验证、研究问题的界限不明确、在复杂问题的研究中算法的精确度不...  相似文献   

17.
计算机大容量硬盘及大数据的海量内容导致硬盘存储的信息越来越多,这给数据挖掘、敏感信息发现等技术提出了新的挑战。针对这一问题,本文基于当前计算机普遍采用的多核CPU处理技术,研究分析了文本分割技术,对C++AMP异构并行编程模型和多线程并行编程模型进行了分析比较,提出了一种基于多核处理器的并行搜索技术,以达到提高文本匹配搜索速度的目的。  相似文献   

18.
基于中国知网数据库收录的22种工程索引期刊文献中涉及微电网的期刊文献数据,借助可视化分析软件CiteSpace对所采集文献的作者和机构进行了分析,描述了该领域的研究力量分布。基于CiteSpace软件的关键词共现和突现词检索功能,以关键词为研究点,绘制了微电网可视化知识图谱,从定量角度得出了微电网领域的技术热点、前沿关注点和发展趋势。  相似文献   

19.
基于目前互联网的信息与日俱增而用户评论信息利用度很低的现状,提出了一种基于最大熵分类器进行评论信息抽取的方法,并结合自然语言处理技术,利用同义词林以及反义词林定位产品评论属性值的语义极性。最后,通过试验验证了评论信息抽取方法的可行性。  相似文献   

20.
基于可拓学的自然语言处理与系统建模研究   总被引:2,自引:0,他引:2  
研究了将可拓模型的自动建模技术应用于自然语言处理,并将此模型应用于自然语言理解.利用可拓模型及自然语言理解相关技术来描述语言信息、知识表示和知识推理,并设计实现了一套由自然语言到可拓模型的自动建模系统.通过构建基于知网的物元概念表、事元概念表和关系元概念表去训练输入的自然语言文本,从中提取出具有一定成熟度的基元模型,再通过基元可拓变换规则进行可拓推理.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号