首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
朱卫星  徐伟光  何红悦  李雯 《计算机科学》2017,44(Z11):411-413, 456
文本数据是存储和交换信息最自然的方式,文本挖掘技术可以发现海量文本数据中隐藏的潜在知识模式。研究了文本数据主题挖掘与关联搜索技术,首先通过文本解析提取、分词预处理和索引等进行文本信息处理,然后利用基于潜在语义关系的主题发现模型挖掘大量文本数据中隐藏的主题信息,最后利用主题模型计算关键词间的关联程度进行查询扩展,从而实现关联搜索。实现了一个文本数据挖掘与关联搜索的原型系统,对Tancorp数据集进行主题发现和关联搜索,并以视化和网页同步显示关联搜索的过程。  相似文献   

2.
主题建模是非常重要的一类文本挖掘方法,被广泛用于构建文本语料库的主题,但其存在难以解释和调整的问题.为了协助用户构建字典以及帮助用户理解主题模型并调节模型,设计并实现了渐进式可视化分析框架,包含2个可视化工作区:语料库优化可视化工作区,协助用户高效构建字典;主题模型可视化工作区,提供多尺度信息可视化以辅助用户理解主题模型并交互地改进主题建模.实现了Web环境下的交互式可视主题模型系统TMvis,并采用20newsgroups新闻数据设计了对照实验,证明了方法的有效性.此外,实现了针对豆瓣电影数据的案例分析,验证了系统的实用性.  相似文献   

3.
可视化搜索用户界面直观且交互能力强,已在众多搜索引擎中被大量采用.文中对可视化用户界面在搜索系统中的应用进行了总结,分别就查询表达式如何可视化以及搜索结果的可视化组织进行了深入探讨;详细介绍了基于分类和基于特征的查询表达式可视化,以及可视化结果组织方法.最后对可视化搜索用户界面领域进行了展望,认为自然化的交互方式、非文本数据、数据规模以及社会化将对该领域产生巨大影响,相关技术值得进一步探索.  相似文献   

4.
当前信息环境下,非结构化文本是各类信息的重要组成部分,如何针对用户信息需求,从文本数据中快速提取所需信息,为用户提供快速高效的信息获取方式成了当前信息服务领域亟待解决的问题.该文基于语义检索以及抽取式文档阅读理解模型,研究了如何快速有效地从大型文档库中根据用户问题提取出所需答案信息的技术,构建了基于文档库的信息服务问答系统.对于解决当前海量信息环境下快速有效的帮助用户获取所需信息,提升信息服务效率具有重要意义.实验表明,该系统可以快速精确的定位用户所提问题的答案,帮助用户快速有效的获取所需信息.  相似文献   

5.
用户驱动的微博可视化搜索   总被引:1,自引:1,他引:0       下载免费PDF全文
目的 微博作为一个社交与信息分享平台,日信息量数以亿计,如何高效地搜索用户感兴趣的信息成为亟待解决的问题.提出了一个新颖的用户驱动的可视化微博信息搜索方法.方法 采用特征词及其权重来建模用户的兴趣特征,并基于此建立用户与特征词之间的相关关系.搜索微博信息时,首先定位与检索词相关的微博用户,在相关微博用户的微博中筛选与搜索相关的微博.另外,采用关注度传递算法对搜索进行扩展,将返回的特征词和微博用户进行可视化展示,并提供交互供用户查看与选定特征词或用户相关的微博.结果 实验结果表明,基于本文方法,用户可以高效地定位感兴趣的微博信息.结论 以用户作为桥梁,大大缩小了微博信息的搜索范围,同时采用关注度传递算法对搜索进行扩展,对结果进行可视化展示.实验表明本文方法能够使用户快速搜索出感兴趣的信息.  相似文献   

6.
该文设计并实现了一个基于本体的动态信息收集Agent系统,该系统基于本体知识对文档进行领域本体分类和规范用户的检索请求,对信息收集的结果进行主题相关的链接分析,抽取出信息源组织结构知识,并根据获取的知识控制系统搜索策略,从而能够有效地处理动态信息收集。  相似文献   

7.
基于Agent的个性化信息过滤系统的设计与实现   总被引:3,自引:0,他引:3  
针对用户个性化服务的特定需求,文中提出了一种基于Agent的个性化信息过滤系统的设计思想及其实现过程。采用基于主题的过滤和基于兴趣的过滤相结合的过滤方法对信息分两次过滤,同时利用Agent跟踪用户的浏览行为,从而提供隐式反馈。系统能够根据文本的内容自动判别文本所属主题分类,并计算待过滤信息与用户兴趣之间的相关度,最后利用用户的反馈对用户兴趣模型进行更新,从而帮助用户准确获取有用信息。  相似文献   

8.
研究基于网络的文本知识发现,根据搜索引擎分类内容的特点,通过几种常用搜索引擎的比较,结合文本分类的特点,发现单纯搜索文本信息资源的引擎更适合于文本分类;进而给出基于文本分类的网络信息获取原型,提出基于元数据的用户感兴趣知识的提取模式,用户可以根据实际情况在给定范围内提取自己感兴趣的文本信息,从而提高文本信息挖掘的精准性。  相似文献   

9.
针对用户个性化服务的特定需求,文中提出了一种基于Agent的个性化信息过滤系统的设计思想及其实现过程。采用基于主题的过滤和基于兴趣的过滤相结合的过滤方法对信息分两次过滤,同时利用Agent跟踪用户的浏览行为,从而提供隐式反馈。系统能够根据文本的内容自动判别文本所属主题分类,并计算待过滤信息与用户兴趣之间的相关度,最后利用用户的反馈对用户兴趣模型进行更新,从而帮助用户准确获取有用信息。  相似文献   

10.
主要研究了基于深度学习技术挖掘用户搜索主题相关的感兴趣内容。通过深度挖掘算法分析用户搜索记录、查询历史以及用户感兴趣的相关文档视为用户搜索主题数据的来源,进而挖掘兴趣主题。挖掘模型主要采用向量空间模型,将用户搜索主题模型表示成用户搜索主题向量形式。形成主题和用户兴趣关系网,用户搜索主题向量的构造过程:选择一组用户查询词,并对它们进行深度挖掘分类,最后用它们构造用户搜索主题特征向量,进而分析用户兴趣点。结合用户随着时间的变化,以及过程中有不用的搜索词,以及无关的搜索噪声词去掉,调整兴趣度,用户搜索主题需要具有更新学习机制,动态跟踪了用户兴趣变化趋势。该用户搜索主题研究过程克服了数据稀疏、类别偏差、扩展性差等缺点。实验结果表明,该模型识别用户搜索主题准确率良好。  相似文献   

11.
12.
景象提取的目的是将数字图像中的景物从背景中分离出来,为了更好地实现这一目的,微软亚洲研究院Jian Sun等人于2004年提出Poisson Matting方法.该方法将透明度(α值)作为图像的一种内在属性,变分地寻求其最优解,来达到目标提取的目的.主要介绍Poisson算法,针对Poisson算法中程序运行时间比较长的问题,对算法中耗用时间多的两个步骤:图像初始α值的计算以及前景图像F、背景图像B的计算进行了改进,在VC6.0中进行了实现,并取得了较好效果.  相似文献   

13.
CSCW系统中协同感知的研究   总被引:1,自引:0,他引:1  
协同感知理论的研究与应用是计算机支持的协同工作的重要研究内容之一.在研究分析了传统的协同感知所依赖的CSCW体系结构的基础上,提出了一种基于P2P的三层结构的协同感知框架,该架构很适合于CSCW中项目可以划分为若干个相对独立的模块的情形.最后对该框架的具体感知模块进行了分析,并讨论了下一步研究将要解决的问题.  相似文献   

14.
开放环境下信息的安全与保护有着重要的研究价值。对待隐藏文件无需专门分配存储空间,而是将其转移存储到系统文件的内部碎片中。隐藏文件的文件名、带路径的宿主文件名及二者对应关系加密后分别存放在两个普通文件中。实验及研究表明此种方式能够对数据做到深度隐藏。  相似文献   

15.
基于XQuery查询优化的研究   总被引:3,自引:0,他引:3  
XML已经成为网络上信息描述和信息交换的标准,随着XML应用得越来越广泛,人们提出了多种XML 数据的查询方法.但是,很多查询方法都有各自的局限性.利用有意义的最小公共实体结构EntityInMLCAS(Entity In Meaning Lowest Common Ancestor Structure)原理,提出一种优化查询方法.同时采用堆栈技术的方法对XML文档结点树进行自顶向下的遍历,该方法大大提高了优化查询的速度.  相似文献   

16.
基于RBAC的WEB环境下OA系统权限控制的研究   总被引:2,自引:0,他引:2  
WEB环境下OA(Office Automation)系统的权限控制是一个热点问题.针对此问题详细介绍了一种实用的解决方法--基于角色访问控制模型的方法,并在此基础上根据实际项目重点阐述了RBAC数据库的设计方法,以及基于RBAC数据库的权限控制的设计方法,最后给出权限子系统的具体配置步骤,并给出实际运行结果.  相似文献   

17.
针对MapReduce的默认调度策略先进先出(FIFO)在执行任务时考虑本地性调度带来的任务等待时间长、资源利用率不高和没有考虑任务的优先级等问题,提出一种基于集群拓扑结构的工作流实时调度算法。MapReduce在对工作流进行Map处理时,首先根据taskTracker的计算能力和数据大小对map阶段工作流的完成时间进行估计,得到一个完成时间隶属函数,然后再利用集群的拓扑结构,得到taskTracker在集群中的距离隶属函数,根据这两个隶属函数来对集群中的taskTracker在工作流处理时间和数据传输时间进行综合性能评估,这样可以有效地缩短任务的等待时间并提高资源的利用率。同时该算法采用对作业进行优先级划分的方式,满足不同类型作业的需求。大量的实验结果表明:该优化策略在平均完成时间和平均等待时间方面要优于FIFO算法,可以有效提高工作流处理的实时性。  相似文献   

18.
对MapReduce工作流的优化主要是通过对MapReduce栈的优化实现的。针对MapReduce工作流的优化问题,首先,提出相关概念;其次,介绍MapReduce工作流基于成本的优化过程;然后,通过实例阐述MapReduce工作流中的数据流依赖和资源依赖关系。基于此,提出3种MapReduce工作流优化器,并对其进行端对端的评估。最后,通过实验评估工作流优化器的优化开销并对比分析了这3种工作流优化器。  相似文献   

19.
基于MDA的构件开发方法的研究   总被引:1,自引:0,他引:1  
在对目前构件技术研究的现状进行分析的基础上,详细讨论了MDA(Model-Driven Architecture)方法产生的背景及其涉及的核心技术,论述了MDA对软件开发产生的深远意义,提出了一种基于MDA的构件开发方法MDAC,并从不同的层次分析了MDAC方法的体系结构,主要包括模型分类、构件建模框架、模型转换实现、构件开发过程、建模工具等内容。  相似文献   

20.
介绍基于Google Earth应用系统开发的基础知识和模式,分析了Google Earth增值业务架构,提出了基于J2EE的KMLServer增值服务器框架,并给出了一个KML Server应用范例。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号