首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
电子文本病历语料库可提供相关医学影像的定性诊断结果,但缺乏直观影像和文本标注信息,不利于有效管理医学数据和医科学生自主学习相关医学知识.针对此问题,文中提出基于深度水平集算法的医学影像分割方法,对医学影像进行自动分割,给出感兴趣区域的轮廓结果及相关定量指标,并结合自然语言处理方法实现电子病历文本的标注,增强影像与文本病历多模态语料库的信息表征能力.在青光眼影像数据上的实验表明,文中方法可精准分割眼底图像中视盘和视杯,有效构建具有直观影像标记与对应病历文本的多模态语料库.  相似文献   

2.
社交网络的发展为情感分析研究提供了大量的多模态数据.结合多模态内容进行情感分类可以利用模态间数据的关联信息,从而避免单一模态对总体情感把握不全面的情况.使用简单的共享表征学习方法无法充分挖掘模态间的互补特征,因此提出多模态双向注意力融合(Multimodal Bidirectional Attention Hybrid...  相似文献   

3.
4.
针对现有的人群分类方法忽略地理位置隐含的功能特征及其访问概率的问题,提出了一种基于位置语义和概率的人群分类方法。该方法主要包括位置语义发现和访问概率向量聚类两部分:首先,采用位置语义发现方法得到位置词汇所隐含的位置语义;其次根据位置语义分配情况获得移动用户对位置语义空间的访问概率向量;最后将其作为聚类分析的权向量,实现人群分类。实验结果表明,该方法提取出的位置语义与现实相符,得到的同类用户在位置语义空间的访问概率向量相似。与现有的人群分类方法相比,本文提出的人群分类方法F-measure值提高了4%,实验效果更优。  相似文献   

5.
肖琳  陈博理  黄鑫  刘华锋  景丽萍  于剑 《软件学报》2020,31(4):1079-1089
自大数据蓬勃发展以来,多标签分类一直是令人关注的重要问题,在现实生活中有许多实际应用,如文本分类、图像识别、视频注释、多媒体信息检索等.传统的多标签文本分类算法将标签视为没有语义信息的符号,然而,在许多情况下,文本的标签是具有特定语义的,标签的语义信息和文档的内容信息是有对应关系的,为了建立两者之间的联系并加以利用,提出了一种基于标签语义注意力的多标签文本分类(LAbel Semantic Attention Multi-label Classification,简称LASA)方法,依赖于文档的文本和对应的标签,在文档和标签之间共享单词表示.对于文档嵌入,使用双向长短时记忆(bi-directional long short-term memory,简称Bi-LSTM)获取每个单词的隐表示,通过使用标签语义注意力机制获得文档中每个单词的权重,从而考虑到每个单词对当前标签的重要性.另外,标签在语义空间里往往是相互关联的,使用标签的语义信息同时也考虑了标签的相关性.在标准多标签文本分类的数据集上得到的实验结果表明,所提出的方法能够有效地捕获重要的单词,并且其性能优于当前先进的多标签文本分类...  相似文献   

6.
网页广告与当前页面内容不匹配使得广告的投放效果降低。本文使用基于站点的贝叶斯模型扩展和基于维基百科的语义扩展两种方法,精确提取网页的标签信息,用更加精确的标签去匹配网络广告,增强了广告效果。本文实现了一个基于语义扩展的网页标签推荐系统,实验证实效果良好。  相似文献   

7.
徐琳宏  刘鑫  原伟  祁瑞华 《计算机科学》2021,48(11):312-318
俄语的多模态情感分析技术是情感分析领域的研究热点,它可以通过文本、语音和图像等丰富信息自动分析和识别情感,有助于及时了解俄语区民众和国家的舆论热点.但目前俄语的多模态情感语料库还较少,因而制约了俄语情感分析技术的进一步发展.针对该问题,在分析多模态情感语料库的相关研究及情感分类方法的基础上,首先制定了一套科学完整的标注体系,标注内容包括话语、时空和情感3个部分的11项信息;然后在语料库的整个建设和质量监控过程中,遵循情感主体原则和情感连续性原则,拟订出操作性较强的标注规范,进而构建出规模较大的俄语多模态情感语料库;最后探讨了语料库在解析情感表达特点、分析人物性格特征和构造情感识别模型等多个方面的应用.  相似文献   

8.
安亚巍  操晓春  罗顺 《计算机科学》2018,45(Z6):396-397, 410
针对大规模领域主题词表提取的问题,提出根据给定语料中词共现特征构建词共现特征矩阵的方法。在此基础上进行词簇划分,进而计算出每个词簇的中心词,并以中心词为核心重新组织每个词簇,最终实现面向语料的主题词表的自动构建。实验结果表明,该算法具有较高的准确率和召回率。  相似文献   

9.
文本通过自然语言处理的自动化摘要方法以去除冗余,设计了语文作文语料标签智能化提取方式.明确了标签智能化提取效果评估指标,确保提取效果与精确度.以自动化抽取文本摘要方法、词典分词方法、有监督命名实体识别方法为技术框架,设定语文作文语料标签实践运用场景设置评估指标,以此开展测试试验分析.结果表明,基于本文设计的语文作文语料...  相似文献   

10.
《计算机工程》2018,(3):226-232
针对多数舆情监控系统对领域知识考虑不足的问题,提出一种基于语义网络的舆情信息分类方法。运用逆文档词频技术拓展公开知识图谱,利用语义网络对舆情信息进行建模,以语义网络中概念节点的映射值表示舆情信息,通过相关概念的互相映射产生增益从而突出舆情信息主题,且可根据舆情信息中的概念发现文中未显式的相关概念,从而反映舆情信息的总体情况。结合主流分类器进行对比实验,结果表明基于语义网络的舆情信息分类技术具有更好的分类效果。  相似文献   

11.
针对特定领域语料采集任务,设计了基于语义相关度主题爬虫的语料采集方法.根据选定的主题词,利用页面描述信息,基于维基百科中文语料训练出的词分布式表示综合HowNet计算页面信息相关度,结合URL的结构信息预测未访问URL链指的页面内容与特定领域的相关程度.实验表明,系统能够有效的采集互联网中的党建领域页面内容作为党建领域生语料,在党建领域网站上的平均准确率达到94.87%,在门户网站上的平均准确率达到64.20%.  相似文献   

12.
刘海旭  郑岩 《软件》2012,33(12)
社会化标签正被广泛的应用在网页文本的描述和分类方面,能够直接反映用户兴趣和商品特征,因而可用于个性化推荐系统中.在进行标签推荐时,需要考虑到标签间的关联度,而现有的标签关联度算法都是基于标签之间的共现关系或者直接基于语义词典,这些算法未考虑到标签与资源的相关性和资源与资源的相关性.本文提出了基于语义的标签关联算法,首先通过潜层狄利克雷分配模型和向量空间模型求得资源间的相关度,然后通过概率模型求得标签与资源的相关度,最后求得标签间的关联度.实验结果表明:基于语义的标签关联算法能够有效的提升社会化标签推荐系统的性能,与语义词典在语义上基本一致且能够实现语义词典未登录词的关联.  相似文献   

13.
进入21世纪以来,知识数据大量存储在文档中,但各类文档的粒度和结构不便于知识的加工、整合和管理. 如何从这些无序的、非结构化的数据(知识)源中提取语义,首要任务是将蕴藏在数据、信息中的知识抽取出来,建立文本资源的语义网,采用RDF来表示语义数据,其次采用TFIDF算法计算得出文本特征词的可信度,最后将文本信息录入到数据库中,实现文本类资源的自动分类,最终目的是实现文本资源知识的共享.  相似文献   

14.
中文短文本具有长度短以及上下文依赖强的特点。目前主流的基于词向量的双向循环神经网络分类方法依赖于词向量语义表达以及上下文特征提取能力,其分类准确率有待进一步改善。针对此问题,论文提出融合语义增强的中文短文本分类方法,该方法提出融合语义增强的思想,在词向量表示阶段,引入Bert生成融合字、文本以及位置的向量作为训练文本的词表征进行文本语义增强,接着输送到Bi-GRU网络中提取上下文关系特征,并通过多头注意力机制调整权值强化重要特征表达,最后使用softmax分类器进行文本分类。通过与其他主流方法进行对比论证,实验表明,论文提出的方法在短文本分类效果上有显著提升。  相似文献   

15.
大规模高质量双语平行语料库是构造高质量统计机器翻译系统的重要基础,但语料库中的噪声影响着统计机器翻译系统的性能,因此有必要对大规模语料库中语料进行筛选。区别于传统的语料选择排序模型,本文提出一种基于分类的平行语料选择方法。通过少数句对特征构造差异较大的分类器训练句对,在该训练句对上使用更多的句对特征对分类器进行训练,然后对其他未分类句对进行分类。相比于基准系统,我们的方法不仅缩减40%训练语料规模,同时在NIST测试数据集合上将BLEU值提高了0.87个百分点。  相似文献   

16.
该文从研究背景、设计思路、标注体系和方法、加工步骤等方面介绍了汉语语义倾向语料库的建设过程。该语料库是一个以研究语言主观性表达为目的的共时、非平衡、单语标注语料库,依据语言主观性多维度描述体系而设计,规模为100万字,配备有集检索与统计、结果检查与可视化于一体的专用语料库工具箱系统,具有可用性大、标注质量高、语言学理据强等特点。  相似文献   

17.
藏语微博是目前流行的藏文网络媒体形式。对藏文微博文本进行情感挖掘,能够有效提高政府对藏语言的监测能力。传统的文本分类方法对中文微博能够达到不错的效果,但由于藏文具有自身的语言特点,传统方法对藏语的分类效率并不高。本文提出了一种基于语义空间的藏文微博情感分析方法。该方法首先使用句法树生成句法结构;然后结合句法结构和语义特征向量构建语义特征空间,在特征空间中通过K-means方法聚类形成语义簇质心;最后计算基于簇的TF-IDF值作为最终的微博情感特征值。实验结果表明,与目前常用的SVM TF-IDF和Naive Bayes 最大熵方法相比,该方法能更准确地对藏文微博进行情感分类。  相似文献   

18.
基于大规模语料库的汉语词义相似度计算方法   总被引:1,自引:0,他引:1  
词义相似度的计算是自然语言处理领域的关键问题之一,它在信息检索中的查询扩展、机器翻译中的模块识别,以及句法分析、词义消歧等任务中都发挥着重要的作用。该文研究了基于大规模语料库的汉语词义相似度计算方法,系统地比较分析了上下文特征权值的选择、向量相似度计算方法、基于窗口和基于依存关系的表征形式、新闻语体和网络语体的差异。实验结果表明,在网络语言语料上,基于窗口选取上下文特征,用互信息PMI来计算权值,采用cosine来计算相似度,取得了最好的词义相似度结果。  相似文献   

19.
郭元博  吴青粟 《计算机工程》1999,25(10):12-13,16
介绍了一个用于多模态规划的多Agent系统。为了显示被表示对象之间的语义关系,表示规划需满足一定的约束,阐述了多Agent合作进行规划的机制,重点论述了约束的传播以及动态修改。  相似文献   

20.
《计算机工程》2017,(10):216-221
现有的卷积神经网络方法难以对图像的每个像素进行语义识别,较难从像素层面分解出图像的不同类别。为此,提出一种端到端的全卷积深度网络,以实现高分辨航拍图像像素级的语义分割及识别。通过全卷积神经网络对图像强度信息和地理信息系统信息分别采用独立通道进行处理,在全卷积神经网络的最终层合并2个通道,并对每个像素进行全连接像素级标注,利用条件随机场作为后期处理方法平滑相似区域,同时保留图像中的边缘信息。实验结果表明,与传统视觉语义分类算法相比,该算法在航拍图像像素级分类上的准确率更高,识别效果更好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号