首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对当前大量电子病历信息无法充分利用的问题,研究了面向电子病历中文医学信息的主题建模及可视组织方法.首先基于电子病历数据和医疗问答数据,进行预处理并转换为纯文本语料,然后采用基于Mallet的LDA主题模型训练算法进行主题建模,并结合主题模型分析的需求进行可视组织与呈现,最后构建了面向中文医学信息的可视分析系统.实例验证表明该系统可以有效的辅助用户进行主题模型的构建与分析,并有利于进一步的诊断.  相似文献   

2.
周永英 《自动化技术与应用》2021,40(11):127-130,135
为提升英文语料库分词精准度,以英文语料库作为研究对象,采用改进的K-SVD算法,构建一个分词特征提取模型.利用稀疏编码与字典更新两个步骤,将初始数据替换为更高级别的特征表示,作为K-SVD算法输入项来获取最优字典.基于模型开发平台,采用文本预处理模块、文本网络构建模块、特征提取模块以及特征加权模块,构建英文语料库分词特征提取模型.选取近十年的新闻素材作为英文语料库,组成训练集,根据分词特征提取结果与提取效果度量指标数据,验证所建模型具有语义辨别与文本还原的有效性,且准确率与召回率也有显著优越性.  相似文献   

3.
文中介绍了大规模文本网数据的主题建模研究的特点和近年来的重要进展.主题建模方法吸引了世界范围的广泛兴趣,并且促进了许多重要的数据挖掘、计算机视觉和计算生物应用系统的发展,包括文本自动摘要、信息检索、信息推荐、主题检测和追踪、自然场景理解、人体动作识别以及微阵列基因表达分析等.文中重点介绍文本网数据的4个主要特点以及对应的主题模型.文本网数据含有动态、高阶、多通路及分布式的结构,而之前的主题模型仅对部分的结构进行建模.而文中讨论了在三维马尔可夫模型的框架下统一对文本网数据的4个结构特点进行建模,并分析了结合三维马尔可夫模型和二型模糊系统对分布式单词计算和主题建模应用的可能性.除了对文本网数据的结构建模之外,还讨论了一些对三维马尔可夫模型能量最小化的机器学习算法.  相似文献   

4.
基于RUP的UML建模方法在电子地图系统开发中的应用*   总被引:4,自引:0,他引:4  
以电子地图系统的开发为背景,介绍了在面向对象应用系统的分析与设计过程中,应用基于RUP的UML的建模技术进行系统建模的方法。在对系统进行需求分析的基础上,灵活选用UML提供的语言丰富的可视化表达元素,构建了系统的用户需求模型、混合模式体系架构模型、分析设计模型和实现模型。  相似文献   

5.
深度学习在各个领域得到了普遍的应用,但是用户在应用深度学习时仍然面临两方面的问题:1)深度学习有着复杂的理论背景,非专业用户缺乏建模以及调优的背景知识,难以构建性能优化的模型;2)数据预处理、模型训练、预测等过程往往涉及比较复杂的编程实现,给没有程序设计基础的非专业用户在入门时带来了一定的困难.针对以上两点易用性问题,文中提出了一种易用的深度学习模型可视化构建系统DragDL,其目的在于降低用户进行数据预处理、模型训练、监控、在线预测等工作的难度.该系统基于PaddlePaddle框架,支持以拖拽图形算子的方式在画布上搭建深度学习网络结构以及推理预测功能,并将数据预处理操作过程抽象成数据流图展示,以方便用户理解和调试.系统还提供训练过程中的质量监控和性能监控的可视化功能,帮助用户实时观察训练情况.同时,DragDL提供经典模型库帮助用户完成建模任务,支持以微调经典模型的方式构建新的模型,降低用户建模时的难度.DragDL基于集群服务器和Web客户端进行部署,服务器为每个训练任务构建虚拟机服务,并支持大规模异步任务调度,具有一定的并发处理能力.  相似文献   

6.
传统新闻媒体和新兴社交媒体对同一事件的观点有差异,且互相影响.为了有效地分析不同来源的新闻事件评论主题的异同以及随着时间推移互相影响的转移趋势,提出一套可视分析方法.首先提出一个基于主题分析的信息传递模型,使用LDA模型提取文本主题,通过计算主题的内容相关性和时间相关性得到主题间的传递关系;然后使用基于桑基图和时间线技术相结合的方法对主题传递模型进行可视化,并提供主题层级视图、关键词词距视图和原数据视图帮助用户理解主题;最后研发了可视分析系统原型.使用"韩国部署萨德事件"这一案例,验证了系统的可用性和有效性.  相似文献   

7.
传统新闻媒体和新兴社交媒体对同一事件的观点有差异,且互相影响.为了有效地分析不同来源的新闻事件评论主题的异同以及随着时间推移互相影响的转移趋势,提出一套可视分析方法.首先提出一个基于主题分析的信息传递模型,使用LDA模型提取文本主题,通过计算主题的内容相关性和时间相关性得到主题间的传递关系;然后使用基于桑基图和时间线技术相结合的方法对主题传递模型进行可视化,并提供主题层级视图、关键词词距视图和原数据视图帮助用户理解主题;最后研发了可视分析系统原型.使用"韩国部署萨德事件"这一案例,验证了系统的可用性和有效性.  相似文献   

8.
接警日志包含时间、空间和案件描述信息,属于非结构时空数据.与时空社交媒体相比,接警日志的数据项之间存在较少的联系,数据项之间不能形成复杂网络关系,在挖掘其数据模式时难以提供有价值的线索,因此,其分析更加依赖于其中的语义挖掘和语义时空模式探索.针对这一问题,提出了一个可视分析框架支持对大规模非结构接警日志时空模式的交互探索.首先,提出了一种基于主题模型集成的方法,实现从异构文本中抽取主题;其次,该框架包含一个数据立方体,实现快速响应用户的查询请求;第三,设计并实现了一个可视化交互系统,支持对数据立方体的可视化交互探索.最后,使用国内某城市真实接警日志进行实验,找到的丰富的模式和主题预测准确性证明了方法的有效性.  相似文献   

9.
基于RUP的UML建模方法在人事招聘系统开发中的应用   总被引:1,自引:0,他引:1  
以人事招聘系统的开发为背景,介绍在面向对象应用系统的分析与设计过程中,应用基于RUP的UML的建模技术进行系统建模的方法。在对系统进行需求分析的基础上,灵活选用UML提供的语言丰富的可视化表达元素。构建系统的用户需求模型、混合模式体系架构模型、分析设计模型和实现模型。  相似文献   

10.
基于问句语料库的受限领域自动应答系统   总被引:3,自引:0,他引:3  
自动应答系统中对用户所提问句的理解是系统实现的关键,同样也是一个难点,通过在受限领域内建立问句语料库来协助理解用户问句是一种非常有效的实现方法。文章分析了建行领域业务咨询系统的问句收集、分词和词性标注、语义标注、问句语料统计等问句语料库的建设过程,并详细介绍了采用词向量空间法和语义向量空间法从问句语料库中寻找和目标问句相似问句的计算方法及提取答案的实现过程。  相似文献   

11.
基于UML的信息模型中数据字典的设计与实现   总被引:2,自引:0,他引:2  
针对传统信息模型中,数据字典的构建模式无法接纳新资源信息的加入,扩展性较差的不足,提出了一种可扩展的数据字典体系的结构设计方法.用UML对系统进行分析和建模,并基于J2EE规范、MVC设计模式等思想,对该字典体系进行了开发实现.该字典体系目前已经在教育部"高等学校仪器设备和优质资源共享系统"中得到应用和验证.  相似文献   

12.
陈千  桂志国  郭鑫  向阳 《计算机应用》2015,35(2):456-460
针对网络大数据时代文本流的主题演化研究大多基于经典概率主题模型,以词袋假设为前提导致主题的语义缺失问题和批处理问题,提出一种在线增量的基于特征本体的主题演化算法。首先,基于词共现和通用本体库WordNet构建特征本体,用特征本体对文本流主题进行建模;其次,提出一种文本流主题矩阵构建算法,实现在线增量主题演化分析;最后,依据该矩阵提出文本流主题本体演化图构建算法,利用特征本体的子图相似度计算主题相似度,从而获得文本流中主题随时间的演化模式。在科技文献上的实验上,满意度同传统在线潜在狄利克雷分配模型(LDA)不相上下,但时间复杂度降低到O(nK+N)。所提出的方法引入了本体,加入了语义关系标注,可图形化展现主题的语义特征,并在此基础上在线增量地实现了主题演化图的构建,在语义解释性和主题可视化方面更具有优势。  相似文献   

13.
研究阅读过程中的视觉注意行为特征,基于眼动数据和文本主题进行阅读行为特征和文档结构的分析,设计了眼动热区图、圆环图、节点链接图、词云等可视化形式.在此基础上开发了面向阅读辅助的可视分析原型系统,该系统记录专家用户(如老师)的眼动数据,然后通过可视化形式分享给新手用户(如学生).用户实验结果表明,实验组用户的阅读理解客观题和主观题得分平均值分别比对照组用户提高了31.8%和55.0%,阅读和答题总用时比对照组用户平均减少了9.7%,可以有效帮助读者提高阅读效率、快速抓住文章重点和更好地理解文章内容,具有一定的有效性和可行性.  相似文献   

14.
软件问答网站基于关键词的搜索机制往往并不能很好地帮助用户找到问题的答案。众多的返回结果造成信息迷航,用户需要花费额外的时间来筛选出自己所需要的信息。针对这种情况,基于Stack Overflow提供的文本信息,提出通过文本主题聚类结合多刻面技术的方法。对搜索结果以及链接关系等信息进行知识抽取,帮助用户理解搜索结果的主题以及方向。设计一种力导引加树形布局的可视化模型对知识进行表达。实现了一个基于Web的动态交互可视化工具,基本达到了解决信息迷航,帮助用户定位问题答案的搜索优化目的。  相似文献   

15.
提出了一种面向工业过程的可视化建模辨识平台的设计和实现方法.该平台加载了多种辨识算法,并使用OPC技术和各类工控系统进行数据交互,以实现对复杂工业系统的动态特性测试.基于输入输出数据,获得系统的参数模型或非参数模型.对实际工业对象建模辨识的结果,表明该平台大大提高了建模的效率和精度.  相似文献   

16.
随着数据观测和数字计算技术的快速发展,空气质量数据粒度越来越细致,为研究空气质量的细粒度数据内联关系可视化、辅助理解空气污染物的转化规律提供了数据基础.针对蕴含丰富内联特征的大气质量细粒度数据开发了一个内联关系可视分析系统.首先,基于大气质量数据多维属性设计时空数据维度模型增强数据的时空表达,并提出一种基于深度学习的特征提取方法,将空气质量数据从高维空间映射到支持交互可视分析的低维特征空间;然后,设计了一套多视图联动的可视化系统,帮助用户发现空气污染传输中的细粒度内联关系,理解污染传输途径的数据分布特征.用户实例和用户评价结果表明,该系统是有效的.  相似文献   

17.
计算机学科评估需要对学科整体信息进行汇总, 过于依赖专家经验且历届学科评估信息复用程度低. 针对此问题, 该文提出了一种计算机学科评估知识图谱构建方法. 该方法基于CIR模型建模知识图谱, 设计了针对文本数据的基于依存句法分析的无监督命名实体关系抽取方法和针对表格的数据流组合模型抽取知识, 并借助Neo4j图数据库实现知识图谱可视化, 为更多学科知识图谱的构建提供思路和借鉴.  相似文献   

18.
为营造良好的网络环境,系统使用人工智能相关技术,自动化构建语料库,进行微博数据分析与可视化.系统通过网络爬取数据技术获取微博的相关数据;通过机器学习对获取的数据进行情感分析和主题聚类;通过自然语言处理相关技术提取关键词;通过Vue相关技术将数据可视化.  相似文献   

19.
在高度沉浸式的虚拟环境中,由于用户的整体视觉空间被渲染的可视化映射所覆盖,传统鼠标、键盘以及触控屏幕等交互方式无法直接应用到沉浸式环境下,大大影响了分析和理解3D医学数据的效率与准确性.为实现沉浸式虚拟环境下对3D医学数据的交互操作,提出一种基于游标模型的非接触式手势交互方法.首先借助游标模型快速确定手势状态,定义4种手势动作实现位移、缩放、旋转以及剖切4种医学可视化交互操作,并借助弹簧模型改善手势抖动问题;最后以HTC VIVE+Leap Motion构建沉浸式医学可视化系统,定义6项分析任务,对比鼠标、手柄等交互方式,从训练时间、完成时间、操作难度和用户反馈4个方面验证文中方法的有效性.  相似文献   

20.
辅助投保人了解保险产品的条款是保险应用关注的热点问题之一, 借助知识图谱技术辅助人身保险业务开展是一种可行的方法. 本文首先从多源数据中提取并构建人身保险知识图谱LIKG. 具体而言, 构建BERT-IDCNN-BiLSTM-CRF模型提取非结构化文本数据的实体, 通过多种短文本相似度算法以及集成排序算法完成实体对齐; 设计并使用Bootstrapping和分类预测两阶段抽取方法对保险产品进行属性填充. 然后, 根据构建的LIKG, 设计开发原型系统, 该系统使用实体抽取和属性抽取算法提供知识获取功能、设计CF-IIF指标提供属性推荐功能以及实现可视化界面帮助用户快速掌握人身保险产品的信息, 展示LIKG的应用价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号