期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

敬少杰季铎庄云行刘云钊《网络安全技术与应用》2023,(4):54-58

随着社交网络平台的普及和多元化发展，互联网上由匿名用户引起的谣言传播、网络犯罪等社会公共安全问题层出不穷，因此对不同平台上的用户进行身份同一性认定成为网络安全领域亟待解决的问题。本文以开放式社交平台微博上的用户个人简介及其发布的文本信息为研究对象，通过抽取账号上下文构建特征，进而采用不同算法构建二分类模型对其身份进行同一认定研究，并通过策略的融合提升实验结果的准确度，融合后同一认定的准确率达到85%以上。相似文献

2.

面向单一双语网页的双语资源挖掘方法

罗阳季铎张桂平王莹莹《中文信息学报》2011,25(1):110-116

双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要。该文提出一种面向单一双语网页的双语资源挖掘方法,该方法重点采用了以频繁序列模式为特征的SVM分类方法,实现了包含双语资源的单一双语网页的筛选与识别,并以此为基础挖掘具有对译的双语资源。实验结果表明,该方法能够有效改进双语资源挖掘的质量。相似文献

3.

融合词性的Fasttext中文将来时识别

刘云钊季铎马尧敬少杰陈沈洪《网络安全技术与应用》2023,(4):46-49

针对用户未来行为意图快速识别的问题，探讨融合词性特征的Fasttext模型的有效性以及采用不同特征融合的识别准确率，为以后的研究提供一定的借鉴。利用词性特征标记具有时间含义的词。在此基础上，利用伪标签数据集，采用监督学习的方法，分别对词、词性以及对应的n-gram特征进行融合，探究不同特征组合的有效性和准确率。结果表明：融合词性的Fasttext模型可以提高时态意图识别准确率。通过分别对这几类特征融合，使用词、词的n-gram和词性特征的Fasttext模型分类的准确率最高，平均识别的准确率为81.2%。相似文献

4.

基于SAO的专利结构化相似度计算方法

杜玉锋季铎姜利雪张桂平《中文信息学报》2016,30(1):30-36

该文提出了一种基于subject-action-object(SAO)的专利结构化相似度计算方法。传统的基于相似文献

5.

结合短语结构句法的语义角色标注

杨凤玲周俏丽蔡东风季铎《中文信息学报》2018,32(6):1-11

该文提出一种结合短语结构句法的语义角色标注方法。结合短语结构句法对句子进行剪枝、子句抽取处理,然后,对处理过的句子进行语义角色分析并还原。最后,结合短语树对还原后的论元边界进行修正。其中,剪枝包括并列结构、插入语的剪枝,子句抽取针对不同形式的子句有不同的处理方式。边界修正主要是针对某些类型论元进行修正。该文分别在CoNLL2004与CoNLL2005评测语料中做了实验,在CoNLL2005 Shared Task的test_wsj数据集上F值为88.25%,在CoNLL2004 Shared Task的test数据集上F值为85.66%。实验结果表明,引入短语结构句法能有效地提升语义角色的识别效果。相似文献

6.

基于联合权重的多文档关键词抽取技术 总被引：2，自引：0，他引：2

杨洁季铎蔡东风林晓庆白宇《中文信息学报》2008,22(6):75-79

该文提出一种多文档关键词抽取方法,该方法提出ATF×PDF(Average Term Frequency×Proportional Document Frequency)来计算词语权重,并根据候选关键词之间的语义相似度,采用联合权重方法重新计算候选关键词的权重来抽取关键词。该方法综合考虑了词语的频率,词性以及词语之间的语义相似性等信息,实验表明,该方法能有效抽取多个文档的关键词,同基于关键词的聚类标记方法相比,其准确率提高3%,召回率提高7%,F-measure提高4.4%。相似文献

7.

交互式机器翻译中译文查询行为的预测技术

季铎马斌叶娜《计算机应用》2015,35(4):1009-1012

以交互式机器翻译(IMT)为研究背景,针对用户在翻译过程中调用双语查词而导致的鼠标-键盘频繁切换的问题,提出了一种面向翻译查词行为的预测模型。该模型将查词行为转化为当前翻译条件下的译文选择问题,利用对齐模型、翻译模型和语言模型实现了高准确率的查词行为预测。在人工双语对齐语料的测试中,该方法预测准确率约为64.99%,特别对占有比例较高的名词预测正确率可达71.43%,能有效减少人工翻译中的重复性和机械性操作,改善了用户使用交互翻译系统的翻译体验,从而提高翻译效率。相似文献

8.

基于边界距离的多向量文本聚类方法

下载免费PDF全文

蔡东风王智超季铎张桂平《计算机工程与应用》2008,44(3):198-201

文本聚类是自然语言处理中的一项重要研究课题,主要应用于信息检索和Web挖掘等领域。其中的关键是文本的表示和聚类算法。在层次聚类的基础上,提出了一种新的基于边界距离的层次聚类算法,该方法通过选择两个类间边缘样本点的距离作为类间距离,有效地利用类的边界信息,提高类间距离计算的准确性。综合考虑不同词性特征对文本的贡献,采用多向量模型对文本进行表示。不同文本集上的实验表明,基于边界距离的多向量文本聚类算法取得了较好的性能。相似文献

9.

基于反馈学习自适应的中文话题追踪 总被引：7，自引：1，他引：7

王会珍朱靖波季铎叶娜张斌《中文信息学报》2006,20(3):94-100

在话题追踪研究领域,由于话题是动态发展的,在追踪过程中会产生话题漂移的问题。针对该问题以及现有自适应方法的不足,本文提出基于反馈学习的自适应方法。该方法采用增量学习的思想,对话题追踪任务中的自适应学习机制提出了新的算法。该算法能够解决话题漂移现象,并能够弥补现有自适应方法的不足。该算法中还考虑了话题追踪任务的时序性,将时间信息引入到了算法中。本文实验采用TDT4语料中的中文部分作为测试语料,使用TDT2004的评测方法对基于反馈学习的自适应的中文话题追踪系统进行评价,实验数据表明基于反馈学习的自适应方法能够提高话题追踪的性能。相似文献

10.

专利中基于语义角色的术语相似度计算方法

姜利雪季铎蔡东风《中文信息学报》2016,30(4):37-43

术语是由一个到多个单词按照某种语义角色组合而成的,传统的基于统计的相似度计算方法,将术语看作一个基本单元来进行计算,忽略了术语内部的语义角色,且对于上下文信息不丰富的术语,无法利用统计的方法取得理想的效果;基于语义资源的相似度计算方法,所涵盖的词语有限,因此不包含在语义资源中的术语便无法计算相似度。针对这些问题,该文针对专利提出了基于语义角色的术语相似度计算方法,该方法弥补了传统方法的不足。该文对术语内部的单词进行语义角色标注,通过共享最近邻方法计算单词的相似度,然后根据不同的语义角色,利用单词相似度来计算术语相似度。实验表明,该方法与传统方法相比,取得了较好的效果。相似文献