共查询到18条相似文献,搜索用时 78 毫秒
1.
话题识别与跟踪中的层次化话题识别技术研究 总被引:19,自引:0,他引:19
话题识别与跟踪(topic detection and tracking,TDT)旨在发展一系列基于事件的信息组织技术,层次化话题识别(hierarchical topic detection,HTD)是其中一项全新的任务定义形式.通过连续的大规模评测,话题识别与跟踪已成为国际上自然语言处理尤其是信息检索领域的一个研究热点.为此,将自然语言处理与信息检索技术相结合,提出了针对事件特点的切实有效的单粒度话题识别方法,并提出了基于多层聚类的MLCS算法对话题进行层次化组织.所提出的方法具有很好的效果,在TDT2004的HTD评测中,该方法取得了第2名的成绩. 相似文献
2.
3.
4.
基于改进向量空间模型的话题识别与跟踪 总被引:4,自引:0,他引:4
话题识别与跟踪旨在发展一系列基于事件的信息组织技术,通过监测以实现对新闻媒体信息流中新话题的自动识别和已知话题的动态跟踪。文中提供一种利用改进的向量空间模型进行识别和跟踪的方法。没有使用传统向量空间模型中单个向量,而是按照语义将特征词划分为4个组(人物、时间、地点、内容)并形成4个向量空间。每个空间进行独立的权重计算和相似度计算。实验证明这些方法是有效的。 相似文献
5.
话题检测与跟踪的评测及研究综述 总被引:8,自引:0,他引:8
话题检测与跟踪是一项面向新闻媒体信息流进行未知话题识别和已知话题跟踪的信息处理技术。自从1996年前瞻性的探索以来,该领域进行的多次大规模评测为信息识别、采集和组织等相关技术提供了新的测试平台。由于话题检测与跟踪相对于信息检索、信息挖掘和信息抽取等自然语言处理技术具备很多共性,并面向具备突发性和延续性规律的新闻语料,因此逐渐成为当前信息处理领域的研究热点。本文简要介绍了话题检测与跟踪的研究背景、任务定义、评测方法以及相关技术,并通过分析目前TDT领域的研究现状展望未来的发展趋势。 相似文献
6.
本文首先简单介绍了话题发现与追踪的发展史及主要任务,然后重点分析比较了现有话题关联识别模型的使用情况,并测试了文档中各层次知识特征对话题关联识别性能的影响。其测试结果对如何评判已有的识别系统或构建好的识别系统具有一定参考价值。 相似文献
7.
8.
9.
测井曲线识别与跟踪的研究 总被引:2,自引:0,他引:2
王金鹏 《计算机工程与应用》1999,35(7):122-123
用图象处理实现测井曲线的模/数转换,核心问题是对曲线的识别与跟踪,该文探讨有关曲线识别、跟踪的问题及其解决方法。 相似文献
10.
汉语标点句句首话题缺失是机器翻译、信息抽取准确率不高的原因之一。该文从广义话题理论出发,根据汉语话题结构的特点,提出标点句的话题句识别研究方案,包括两个阶段性任务 单个标点句的话题句识别和序列标点句的话题句序列构建。识别出标点句的话题句也就找到了标点句句首缺失的话题。该文解决单个标点句的话题句识别任务,主要采用语义泛化和编辑距离两种手段。实验中开放测试的准确率比基线高出12.51个百分点。该结果说明,运用广义话题理论进行单个标点句的话题句识别可产生明显的效果。 相似文献
11.
12.
13.
14.
新闻专题的阶段性对了解专题的动态演化、勾勒专题的发展轮廓等提供了较高的参考价值,一定程度上弥补了专题内容太多而不便阅读的缺憾。以“马航MH370航班失联”专题为研究对象,探讨了新闻专题阶段性的生成算法,首先利用主题抽取技术对各新闻文档进行主题抽取,完成文档集到主题集的转换,然后借助话题检测与追踪技术对主题集进行基于时间流的双向聚类和正逆向结果交集的再聚类,最终根据话题聚类的结果选择对应文档的主题生成新闻专题的阶段性。实验证明,本文方法能够取得较好的Rouge召回率。 相似文献
15.
运动目标检测与跟踪技术有着广泛的应用,但由于检测和跟踪过程容易受外界环境的干扰而造成失败,因此改进运动目标检测和跟踪算法具有重要意义。本文分类介绍了运动目标检测与跟踪算法的研究现状以及常用算法,比较了各种算法的优缺点,阐述了该课题许多尚未完全解决的问题,并对该领域未来的发展趋势进行展望。 相似文献
16.
微博热点话题发现是目前的研究热点。针对传统热词抽取方法难以适用于微博数据的问题,提出一种基于老化理论的词生命值计算模型用于热词抽取,并基于热词间的相关性构建词共现网络;针对传统的词聚类算法不能较好地解决话题间存在重叠热词以及时间效率不佳的问题,引入多标签传播思想,设计一种接近线性时间复杂度的多标签传播聚类算法( TCMLPA)用于词共现网络的热词聚类,获得热点话题集。实验结果表明,词生命值计算模型能够有效过滤噪声并提取热词,TCMLPA算法则能够在保证聚类结果稳定性的情况下,有效提高热点话题发现的精度和效率。 相似文献
17.
18.
目标跟踪无法有效判断目标何时被遮挡以及同时配合模板更新.针对这一问题,文中提出基于遮挡检测和多块位置信息融合的分块目标跟踪算法.首先,将目标区域分成4个子块,结合目标整体,利用遮挡具有从局部开始和方向性的特点,计算各分块间相关值的比值,判断目标是否遮挡及遮挡部位.再根据目标是否遮挡,采用不同的更新方式.最后,根据未被遮挡的各个分块位置信息确定最终目标的位置.在数据集上的实验表明,文中算法可以有效判定目标是否存在遮挡,并提升遮挡情况下的跟踪效果. 相似文献