共查询到18条相似文献,搜索用时 59 毫秒
1.
随着社交媒体的飞速发展,幽默识别任务受到研究者广泛关注。其目标是判断给定文本是否具有幽默表达。现有方法主要基于幽默产生理论,采用规则或神经网络模型提取多种幽默相关特征,如不一致性、情感和语音等。然而,这些方法未充分捕捉文本内部的情感特征,忽视了隐含在幽默文本中的情感表达,影响了幽默识别的准确性。为解决此问题,该文提出了CMSOR方法,以动态常识和多维语义特征为驱动。首先,利用外部常识信息从文本中动态推理说话者的隐式情感表达;然后,引入WordNet词典计算词级语义距离,捕捉不一致性,并计算模糊性特征;最后,基于这三个特征维度构建幽默语义,实现幽默识别。实验证明,CMSOR模型相对于当前基准模型在三个公开数据集上的识别性能均有显著提升。 相似文献
3.
4.
幽默计算研究致力于利用计算机方法理解和识别幽默表达,挖掘幽默潜在的语义内涵,构建面向幽默的计算模型,实现幽默的自动识别和生成,提升人机交互智能程度.在开发基于幽默计算的人工智能系统的需求日益凸显的趋势下,通过文献调研方式进行幽默识别综述.首先,重点研究了幽默特征的提取方法;其次,从数据和方法两个维度总结了文本幽默识别的研究进展.归纳常用数据集的收集标注过程及特点,系统地对比了包括基于传统机器学习和基于深度学习的文本幽默识别方法;最后,对幽默识别领域的相关研究进行了总结与展望. 相似文献
5.
网络评论短文本的细粒度情感分析是文本挖掘的研究热点,评价对象作为细粒度情感分析的基础,在识别文本过程中具有重要作用,如何充分利用上下文信息并对其进行有效表示是评价对象识别的难点所在。提出一种结合词特征与语义特征的评价对象识别方法。针对商品评论语料,使用条件随机场进行评价对象识别,在词特征、依存句法特征的基础上引入语义特征,并将各特征进行组合,以充分利用上下文信息,提高评价对象的识别准确性。在手机评论和酒店评论2个数据集上进行实验,结果表明,该方法的识别准确性较高,且F值分别高达75.36%和82.64%。 相似文献
6.
7.
幽默识别是自然语言处理的新兴研究领域之一。对话的特殊结构使得在对话中的幽默识别相较于短文本幽默识别更具有挑战性。在对话中,除了当前话语以外,上下文语境信息对于幽默的识别也至关重要。因此,该文在已有研究的基础上结合对话的结构特征,提出基于BERT的强化语境与语义信息的对话幽默识别模型。模型首先使用BERT对发言人信息和话语信息进行编码,其次分别使用句级别的BiLSTM、CNN和Attention机制强化语境信息,使用词级别的BiLSTM和Attention机制强化语义信息。实验结果表明,该文方法能有效提升机器识别对话中幽默的能力。 相似文献
8.
通过对新一代的语义特征模型的分析,参考Bidarra等人的研究成果,运用有效性标准,确立语义特征造型中特征转换的方法,在采用数学方法基础上,提出了怎样在数学模型中把设计特征表示转换成加工特征表示。设计过程中的设计特征由一组具有几何特征的面和一组属性(包括维数和具体特征)表示。加工过程中的加工特征由许多面和这些加工操作中面面之间有意义的关系来表示。特征转换中采用数学方法,能够在集合运算中形成加工特征,特征相交这种困难问题也可用数学描述,并且理论上能够转换,从而提高产品模型的可编辑性和易编辑性。 相似文献
9.
基于生成式的零样本识别方法在生成特征时受冗余信息和域偏移的影响,识别精度不佳.针对此问题,文中提出基于去冗余特征和语义关系约束的零样本属性识别方法.首先,将视觉特征映射到一个新的特征空间,通过互相关信息对视觉特征进行去冗余处理,在去除冗余视觉特征的同时保留类别的相关性,由于在识别过程中减少冗余信息的干扰,从而提高零样本识别的精度.然后,利用可见类和不可见类之间的语义关系建立知识迁移模型,并引入语义关系约束损失,约束知识迁移的过程,使生成器生成的视觉特征更能反映可见类和不可见类之间语义关系,缓解两者之间的域偏移问题.最后,引入循环一致性结构,使生成的伪特征更接近真实特征.在数据集上的实验证实文中方法提高零样本识别任务的精度,并具有较优的泛化性能. 相似文献
10.
《计算机科学与探索》2016,(6):751-760
针对目前基于智能手机的情绪识别研究中所用数据较为单一,不能全面反应用户行为模式,进而不能真实反应用户情绪这一问题展开研究,基于智能手机从多个维度全面收集反应用户日常行为的细粒度感知数据,采用多维数据特征融合方法,利用支持向量机(support vector machine,SVM)、随机森林(random forest)等6种分类方法,基于离散情绪模型和环状情绪模型两种情绪分类模型,对12名志愿者的混合数据和个人数据分别进行情绪识别,并进行了对比实验。实验结果表明,该全面反应用户行为的多维数据特征融合方法能够很好地对用户的情绪进行识别,其中使用个人数据进行情绪识别的准确率最高可达到79.78%,而且环状情感模型分类结果明显优于离散分类模型。 相似文献
11.
基于支持向量机和纹理特征的人脸识别 总被引:2,自引:2,他引:2
提出了一种基于支持向量机和纹理特征的识别方法及框架模型。即在研究支持向量机理论的基础上,采用支持向量机的分类算法实现人脸识别系统的训练和测试,并将图像的纹理特征技术应用于人脸识别的预处理中。实验表明支持向量机和纹理特征相结合可以获得较好的识别率。 相似文献
12.
姚兰 《自动化技术与应用》2021,40(2):182-185
本文基于语义选择与信息特征设计了英语自动化机器翻译系统.通过语义信息特征制定了机器翻译流程,以GIZA++为载体进行翻译,利用伯克利对准器对齐词语,基于反向转换语法,详细阐述汉语语言模式与英语翻译语言模式的结构关联特性,以语句动静配置,实现自动化机器翻译.最后通过系统测试,结果表明,与传统机器翻译系统相比,准确率显著提... 相似文献
13.
赵利权 《数码设计:surface》2009,(11):218-220
幽默产品和幽默语言、动作、漫画等一样能使人在心理上达到一种愉悦状态,因此,幽默化产品的特征与汉语中的幽默语义在本质上是相同的。本文从幽默一词的语义入手,总结幽默语言的特征和技巧,然后把这些特征应用于幽默产品,借助语言学、文学和心理学等方面的知识,总结幽默产品之所以幽默的语义特征。 相似文献
14.
人体行为分析为视频监控系统、视频检索系统提供重要的研究基础。本文提出了一种基于高层语义词袋模型
的人体行为识别方法。该方法根据底层词袋中词汇的相关关系,构造出一个基于词汇交互信息量的底层词汇图;然后使用层
次聚类的方法对该图进行分割,得到底层词汇组模型,最后将该模型表示为高层语义词袋模型。实验结果表明,该方法可以高
效地识别视频中的人体行为。 相似文献
15.
从现代汉语语义学角度,可将句义类型划分为简单句义、复杂句义、复合句义和多重句义4种。作为在整体上对句义结构进行描述的方式之一,句义类型识别是对汉语句子进行完整句义结构分析的重要步骤。该文基于谓词及句义类型块提出了一种汉语句义类型识别的方法,实现了4种句义类型的识别。该方法先通过句中谓词的个数进行初步识别判断出部分简单句,再对剩余的句子先用C4.5机器学习的方法得到句中谓词经过的最大句义类型块的个数,再结合句法结构中顶端句子节点进行判决,最终给出剩余句子的句义类型判定结果。实验采用BFS-CTC汉语标注语料库中10221个句子进行开集测试,句义类型的整体识别准确率达到97.6%,为基于现代汉语语义学的研究奠定了一定的技术研究基础。 相似文献
16.
提出了一种将图像本身的低级特征和语义特征描述相结合的医学图像检索方法。首先提取图像的灰度特征、矩特征和纹理特征,进一步采用遗传算法进行最优特征的选择,由于这些低层特征对图像的描述与人类对图像的描述存在较大差异,直接利用这些特征作为检索依据常得不到满意的结果,因此需要进一步提取语义特征,将影像报告中医生给出的关于图像的描述作为语义内容进行相似性检索。实验结果表明,综合低级特征和语义特征的检索比仅利用低级特征的检索更接近于人的视觉理解。 相似文献
17.
This paper proposes a projection-based symmetrical factorisation method for extracting semantic features from collections
of text documents stored in a Latent Semantic space. Preliminary experimental results demonstrate this yields a comparable
representation to that provided by a novel probabilistic approach which reconsiders the entire indexing problem of text documents
and works directly in the original high dimensional vector-space representation of text. The employed projection index is
derived here from the a priori constraints on the problem. The principal advantage of this approach is computational efficiency and is obtained by the exploitation
of the Latent Semantic Indexing as a preprocessing stage. Simulation results on subsets of the 20-Newsgroups text corpus in
various settings are provided.
This revised version was published online in August 2006 with corrections to the Cover Date. 相似文献