共查询到20条相似文献,搜索用时 0 毫秒
1.
电子文本病历语料库可提供相关医学影像的定性诊断结果,但缺乏直观影像和文本标注信息,不利于有效管理医学数据和医科学生自主学习相关医学知识.针对此问题,文中提出基于深度水平集算法的医学影像分割方法,对医学影像进行自动分割,给出感兴趣区域的轮廓结果及相关定量指标,并结合自然语言处理方法实现电子病历文本的标注,增强影像与文本病历多模态语料库的信息表征能力.在青光眼影像数据上的实验表明,文中方法可精准分割眼底图像中视盘和视杯,有效构建具有直观影像标记与对应病历文本的多模态语料库. 相似文献
2.
社交网络的发展为情感分析研究提供了大量的多模态数据.结合多模态内容进行情感分类可以利用模态间数据的关联信息,从而避免单一模态对总体情感把握不全面的情况.使用简单的共享表征学习方法无法充分挖掘模态间的互补特征,因此提出多模态双向注意力融合(Multimodal Bidirectional Attention Hybrid... 相似文献
3.
4.
针对现有的人群分类方法忽略地理位置隐含的功能特征及其访问概率的问题,提出了一种基于位置语义和概率的人群分类方法。该方法主要包括位置语义发现和访问概率向量聚类两部分:首先,采用位置语义发现方法得到位置词汇所隐含的位置语义;其次根据位置语义分配情况获得移动用户对位置语义空间的访问概率向量;最后将其作为聚类分析的权向量,实现人群分类。实验结果表明,该方法提取出的位置语义与现实相符,得到的同类用户在位置语义空间的访问概率向量相似。与现有的人群分类方法相比,本文提出的人群分类方法F-measure值提高了4%,实验效果更优。 相似文献
5.
自大数据蓬勃发展以来,多标签分类一直是令人关注的重要问题,在现实生活中有许多实际应用,如文本分类、图像识别、视频注释、多媒体信息检索等.传统的多标签文本分类算法将标签视为没有语义信息的符号,然而,在许多情况下,文本的标签是具有特定语义的,标签的语义信息和文档的内容信息是有对应关系的,为了建立两者之间的联系并加以利用,提出了一种基于标签语义注意力的多标签文本分类(LAbel Semantic Attention Multi-label Classification,简称LASA)方法,依赖于文档的文本和对应的标签,在文档和标签之间共享单词表示.对于文档嵌入,使用双向长短时记忆(bi-directional long short-term memory,简称Bi-LSTM)获取每个单词的隐表示,通过使用标签语义注意力机制获得文档中每个单词的权重,从而考虑到每个单词对当前标签的重要性.另外,标签在语义空间里往往是相互关联的,使用标签的语义信息同时也考虑了标签的相关性.在标准多标签文本分类的数据集上得到的实验结果表明,所提出的方法能够有效地捕获重要的单词,并且其性能优于当前先进的多标签文本分类... 相似文献
6.
网页广告与当前页面内容不匹配使得广告的投放效果降低。本文使用基于站点的贝叶斯模型扩展和基于维基百科的语义扩展两种方法,精确提取网页的标签信息,用更加精确的标签去匹配网络广告,增强了广告效果。本文实现了一个基于语义扩展的网页标签推荐系统,实验证实效果良好。 相似文献
7.
俄语的多模态情感分析技术是情感分析领域的研究热点,它可以通过文本、语音和图像等丰富信息自动分析和识别情感,有助于及时了解俄语区民众和国家的舆论热点.但目前俄语的多模态情感语料库还较少,因而制约了俄语情感分析技术的进一步发展.针对该问题,在分析多模态情感语料库的相关研究及情感分类方法的基础上,首先制定了一套科学完整的标注体系,标注内容包括话语、时空和情感3个部分的11项信息;然后在语料库的整个建设和质量监控过程中,遵循情感主体原则和情感连续性原则,拟订出操作性较强的标注规范,进而构建出规模较大的俄语多模态情感语料库;最后探讨了语料库在解析情感表达特点、分析人物性格特征和构造情感识别模型等多个方面的应用. 相似文献
8.
9.
田莉 《自动化技术与应用》2021,40(2):144-147
文本通过自然语言处理的自动化摘要方法以去除冗余,设计了语文作文语料标签智能化提取方式.明确了标签智能化提取效果评估指标,确保提取效果与精确度.以自动化抽取文本摘要方法、词典分词方法、有监督命名实体识别方法为技术框架,设定语文作文语料标签实践运用场景设置评估指标,以此开展测试试验分析.结果表明,基于本文设计的语文作文语料... 相似文献
10.
11.
12.
社会化标签正被广泛的应用在网页文本的描述和分类方面,能够直接反映用户兴趣和商品特征,因而可用于个性化推荐系统中.在进行标签推荐时,需要考虑到标签间的关联度,而现有的标签关联度算法都是基于标签之间的共现关系或者直接基于语义词典,这些算法未考虑到标签与资源的相关性和资源与资源的相关性.本文提出了基于语义的标签关联算法,首先通过潜层狄利克雷分配模型和向量空间模型求得资源间的相关度,然后通过概率模型求得标签与资源的相关度,最后求得标签间的关联度.实验结果表明:基于语义的标签关联算法能够有效的提升社会化标签推荐系统的性能,与语义词典在语义上基本一致且能够实现语义词典未登录词的关联. 相似文献
13.
进入21世纪以来,知识数据大量存储在文档中,但各类文档的粒度和结构不便于知识的加工、整合和管理. 如何从这些无序的、非结构化的数据(知识)源中提取语义,首要任务是将蕴藏在数据、信息中的知识抽取出来,建立文本资源的语义网,采用RDF来表示语义数据,其次采用TFIDF算法计算得出文本特征词的可信度,最后将文本信息录入到数据库中,实现文本类资源的自动分类,最终目的是实现文本资源知识的共享. 相似文献
14.
中文短文本具有长度短以及上下文依赖强的特点。目前主流的基于词向量的双向循环神经网络分类方法依赖于词向量语义表达以及上下文特征提取能力,其分类准确率有待进一步改善。针对此问题,论文提出融合语义增强的中文短文本分类方法,该方法提出融合语义增强的思想,在词向量表示阶段,引入Bert生成融合字、文本以及位置的向量作为训练文本的词表征进行文本语义增强,接着输送到Bi-GRU网络中提取上下文关系特征,并通过多头注意力机制调整权值强化重要特征表达,最后使用softmax分类器进行文本分类。通过与其他主流方法进行对比论证,实验表明,论文提出的方法在短文本分类效果上有显著提升。 相似文献
15.
16.
17.
藏语微博是目前流行的藏文网络媒体形式。对藏文微博文本进行情感挖掘,能够有效提高政府对藏语言的监测能力。传统的文本分类方法对中文微博能够达到不错的效果,但由于藏文具有自身的语言特点,传统方法对藏语的分类效率并不高。本文提出了一种基于语义空间的藏文微博情感分析方法。该方法首先使用句法树生成句法结构;然后结合句法结构和语义特征向量构建语义特征空间,在特征空间中通过K-means方法聚类形成语义簇质心;最后计算基于簇的TF-IDF值作为最终的微博情感特征值。实验结果表明,与目前常用的SVM TF-IDF和Naive Bayes 最大熵方法相比,该方法能更准确地对藏文微博进行情感分类。 相似文献
18.
基于大规模语料库的汉语词义相似度计算方法 总被引:1,自引:0,他引:1
词义相似度的计算是自然语言处理领域的关键问题之一,它在信息检索中的查询扩展、机器翻译中的模块识别,以及句法分析、词义消歧等任务中都发挥着重要的作用。该文研究了基于大规模语料库的汉语词义相似度计算方法,系统地比较分析了上下文特征权值的选择、向量相似度计算方法、基于窗口和基于依存关系的表征形式、新闻语体和网络语体的差异。实验结果表明,在网络语言语料上,基于窗口选取上下文特征,用互信息PMI来计算权值,采用cosine来计算相似度,取得了最好的词义相似度结果。 相似文献
19.
介绍了一个用于多模态规划的多Agent系统。为了显示被表示对象之间的语义关系,表示规划需满足一定的约束,阐述了多Agent合作进行规划的机制,重点论述了约束的传播以及动态修改。 相似文献