首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
2.
通过主题模型对酒店评论文本进行文本挖掘,有利于引导酒店管理者和客户对评论信息做出合适的鉴别和判断。提出一种基于预训练的BERT语言模型与LDA主题聚类相结合的方法;利用中文维基百科语料库训练BERT模型并从中获取文本向量,基于深度学习算法对评论文本进行情感分类;通过LDA模型对分类后的文本进行主题聚类,分别获取不同情感极性文本的特征主题词,进而挖掘出酒店客户最为关注的问题,并对酒店管理者提出具有参考价值的建议。实验结果表明,通过BERT模型获取的文本向量在情感分类任务中表现较好,且BERT-LDA文本挖掘方法能使酒店评论文本的主题更具表达性。  相似文献   

3.
本文在对BP神经网络模型理论分析基础上,将预警指数和BP神经网络二者结合起来建立了财务风险预警的神经网络模型,并用C++语言实现了此神经网络模型。  相似文献   

4.
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系。作为从浩瀚的Web信息资源中发现潜在的、有价值知识的有效技术,Web文本挖掘已倍受关注。文中提出了利用概念格来抽取隐含在文本中潜在的概念关系,将文本挖掘中文档与关键词之间的关系通过概念格结构呈现出来。  相似文献   

5.
王娜  李云松 《微机发展》2006,16(1):114-116
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系。作为从浩瀚的Web信息资源中发现潜在的、有价值知识的有效技术,Web文本挖掘已倍受关注。文中提出了利用概念格来抽取隐含在文本中潜在的概念关系,将文本挖掘中文档与关键词之间的关系通过概念格结构呈现出来。  相似文献   

6.
随着Internet的普及和相关技术的发展,Web上聚集了大量的信息资源。如何从这些Web信息资源中提取有用信息这一问题促使了Web文本挖掘技术的产生。本文首先介绍了粗糙集的相关概念和理论,然后对基于粗糙集的Web文本挖掘技术进行了初步探讨和研究。  相似文献   

7.
许卓斌  郑海山  潘竹虹 《计算机科学》2018,45(6):208-210, 240
词的向量化表达是文本挖掘应用的必要前提。为了改善自编码器在词嵌入中的效果,提高文本分类的准确性,提出了一种改进的自编码器并将其用于文本分类。在传统自编码器的基础上,在隐藏层加入了一个全局调整函数,其将绝对值小的特征值调整到绝对值大的特征值上,实现了隐藏层特征向量的稀疏化。得到调整后的特征向量之后,采用全连接神经网络进行文本分类。在20news数据集上的实验结果表明,所提方法具有更好的词向量嵌入式效果,并且在文本分类中也具有更好的效果。  相似文献   

8.
为了解决医院财务风险监测预警风险存在的预警权重过高,监测准确性较差、效率较低的问题,研究了监测信息的医院财务风险监测预警方法.首先确定硬件的四个模块,在软件部分,主要采用加权综合平均计算方法精准计算单项指标权重.利用监测信息的权重计算结果得出财务风险评分值,将评分值设置为监测预警指数,预警指数与财务风险等级相比较,根据...  相似文献   

9.
随着Internet的普及和相关技术的发展,Web上聚集了大量的信息资源.如何从这些Web信息资源中提取有用信息这一问题促使了Web文本挖掘技术的产生.本文首先介绍了粗糙集的相关概念和理论,然后对基于粗糙集的Web文本挖掘技术进行了初步探讨和研究.  相似文献   

10.
Web文本主题挖掘技术研究   总被引:2,自引:0,他引:2  
目前,如何快速、准确、全面、及时地检索到自己感兴趣的信息已成为人们关注的焦点。本文针对目前搜索引擎精度不高的问题,讨论了Web文本主题挖掘涉及到的相关核心技术,重点讨论自动分词技术和Web文本的特征表示。  相似文献   

11.
WebServices是一种面向服务的体系结构,其优势在于跨平台互操作性和软件复用。金融风险预警系统是一个供金融决策部门使用的综合的决策支持系统。文中对WebServices的体系结构、关键技术进行了探讨,提出了基于WebServices的金融风险预警系统框架结构,证实了WebServices为该系统提供了强大的技术支撑。  相似文献   

12.
Web Services是一种面向服务的体系结构,其优势在于跨平台互操作性和软件复用。金融风险预警系统是一个供金融决策部门使用的综合的决策支持系统。文中对Web Services的体系结构、关键技术进行了探讨,提出了基于Web Services的金融风险预警系统框架结构,证实了Web Services为该系统提供了强大的技术支撑。  相似文献   

13.
预警有助于及时预防和解决隐患,具有重要的应用价值,受到了广泛的关注。提出了一种新的预警机制,以领域相关的预警知识为基础构建预警系统,重点研究了以实际数据为资源,基于背景领域知识挖掘出预警规则,使得预警系统中的预警知识更丰富、更完备、更具有实际应用价值。将上述研究应用于高校教学教务系统的学生成绩预警,实验结果表明所提出的预警机制和方法是有效的。  相似文献   

14.
近年来,机器学习,尤其是深度神经网络方法促进了金融文本挖掘研究的发展,在金融科技(Fintech)领域起着越来越重要的作用.如何从金融大数据中提取有价值的信息已经成为学术界和工业界一个非常有挑战的研究.由于深度神经网络需要大量标注数据,但是金融领域缺乏训练数据,因此,将深度学习应用于金融大数据挖掘并没有取得很好效果.为了更好地解决该问题,利用自监督学习和多任务学习等深度学习领域最新的思想和技术,提出了基于BERT模型架构的开源金融预训练语言模型F-BERT.F-BERT是一种针对特定领域(金融文本数据)的预训练语言模型,它通过在大型金融语料库上进行无监督训练得到.基于BERT架构,F-BERT可以有效地自动将知识从金融大数据中提取出并记忆在模型中,而无需进行特定于金融任务的模型结构修改,从而可以直接将其应用于下游各种金融领域任务,包括股票涨跌预测、金融情绪分类、金融智能客服等.在金融关系提取、金融情绪分类、金融智能问答任务上的大量实验表明了F-BERT模型的有效性和鲁棒性.同时,F-BERT在这3个有代表性的金融文本挖掘任务上均取得了很高的模型准确率,进一步验证了模型的性能.  相似文献   

15.
基于Web的文本挖掘技术研究   总被引:2,自引:0,他引:2  
Internet上大多数信息的表现形式为文本,如何在浩瀚的文本信息中挖掘到潜在的知识是一个有待解决的问题。文本挖掘的目的是从不同格式的文本中发现有用的知识,这是一个分析文本并从中抽取特定信息的过程。系统地介绍了文本挖掘的含义,并对文本挖掘过程的各个方面进行了进一步的探讨,包括文本特征的建立、特征的提取技术、文本的分类、文本的聚类等相关技术。同时提出了一种基于Web的文本信息挖掘的模型,将以高校BBS论坛为信息源,利用高级语言开发技术来构建一个自动的文本分类器。  相似文献   

16.
许高建 《微机发展》2007,17(6):187-190
Internet上大多数信息的表现形式为文本,如何在浩瀚的文本信息中挖掘到潜在的知识是一个有待解决的问题。文本挖掘的目的是从不同格式的文本中发现有用的知识,这是一个分析文本并从中抽取特定信息的过程。系统地介绍了文本挖掘的含义,并对文本挖掘过程的各个方面进行了进一步的探讨,包括文本特征的建立、特征的提取技术、文本的分类、文本的聚类等相关技术。同时提出了一种基于Web的文本信息挖掘的模型,将以高校BBS论坛为信息源,利用高级语言开发技术来构建一个自动的文本分类器。  相似文献   

17.
信贷对现代市场经济非常重要,同时又会带来风险.以人工智能的思想为指导,将SOM与PNN网络相结合.提出并建立了一种基于SOM-PNN的信贷风险预警模型;结合统计理论方法对输入样本进行预处理,解决了网络训练中样本选用的问题;并利用因素分析方法对预警结果进行了解释.实验表明,利用该模型在得到可视化预测结果的同时,还可得到较高的预警精度.  相似文献   

18.
为了提高医院动态财务信息预警能力,提出基于支持向量机的预警方法.结合模糊PID控制方法,构建信息大数据检测和统计信息分析模型,统计特征量和统计函数,采用支持向量机学习方法,通过模糊信息融合方法,利用参数寻优,实现对异常信息的实时监测和预警过程优化.仿真结果表明,采用该方法进行医院动态财务信息预警的准确性较高,实时性较好...  相似文献   

19.
短文本相比于长文本词汇的数量更少,提取其中的语义特征信息更加困难,利用传统的向量空间模型VSM(vector space model)向量化表示,容易得到高维稀疏的向量.词的稀疏表示缺少语义相关性,造成语义鸿沟,从而导致下游聚类任务中,准确率低下,容易受噪声干扰等问题.提出一种新的聚类模型BERT_AE_K-Means...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号