首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 843 毫秒
1.
在电子商务网络资讯管理系统中,为了将用户检索结果网页按照不同主题划分显示给用户,帮助用户快速定位所需信息,有效完善用户体验,针对电子商务领域网页文本聚类面临的问题,提出融合自定义领域词典、基于聚类特征词典的特征选择和基于类别领域词表的初始中心点构造等策略的解决方案。实验结果表明,该方案能有效提高电子商务领域的网页文本聚类质量。对于其它特定领域文本聚类研究具有一定的参考价值。   相似文献   

2.
为了更加有效地检索到符合用户复杂语义需求的图像,提出一种基于文本描述与语义相关性分析的图像检索算法。该方法将图像检索分为两步:基于文本语义相关性分析的图像检索和基于SIFT特征的相似图像扩展检索。根据自然语言处理技术分析得到用户文本需求中的关键词及其语义关联,在选定图像库中通过语义相关性分析得到“种子”图像;接下来在图像扩展检索中,采用基于SIFT特征的相似图像检索,利用之前得到的“种子”图像作为查询条件,在网络图像库中进行扩展检索,并在结果集上根据两次检索的图像相似度进行排序输出,最终得到更加丰富有效的图像检索结果。为了证明算法的有效性,在标准数据集Corel5K和网络数据集Deriantart8K上完成了多组实验,实验结果证明该方法能够得到较为精确地符合用户语义要求的图像检索结果,并且通过扩展算法可以得到更加丰富的检索结果。  相似文献   

3.
为了提高网页目录的构建效率、增加其灵活性,提出了一种改进的文本聚类算法.改进的CBC算法用于快速确定文本的聚类中心,根据网页目录的特点,该算法增加了层次聚类方法,以形成文本类别的层次结构,考虑到网页文本的快速增长,采用增量方式对新网页进行聚类.把该算法应用于网页文本集,产生了有意义的聚类结果,对比K-Means算法,获得了更高的精度,并具有较高的时间性能,实验结果表明了该算法的有效性.  相似文献   

4.
针对小文本的Web数据挖掘技术及其应用   总被引:4,自引:2,他引:4  
现有搜索引擎技术返回给用户的信息太多太杂,为此提出一种针对小文本的基于近似网页聚类算法的Web文本数据挖掘技术,该技术根据用户的兴趣程度形成词汇库,利用模糊聚类方法获得分词词典组,采用MD5算法去除重复页面,采用近似网页聚类算法对剩余页面聚类,并用马尔可夫Web序列挖掘算法对聚类结果排序,从而提供用户感兴趣的网页簇序列,使用户可以迅速找到感兴趣的页面。实验证明该算法在保证查全率和查准率的基础上大大提高了搜索效率。由于是针对小文本的数据挖掘,所研究的算法时间和空间复杂度都不高,因此有望成为一种实用、有效的信息检索技术。  相似文献   

5.
面对当前大量的文本数据信息,如何帮助人们准确定位所需信息,成为文本挖掘领域的一个研究趋势。通过将文本分类和聚类方法应用于信息检索-—对网页文本进行聚类,提出了基于超链接信息的Web文本自动聚类模型。利用结构挖掘技术获得主题领域的多个权威网页作为初始聚类中心,通过去除超链接信息中的噪声和多余链接得到网站的简明拓扑结构,并结合内容挖掘,动态调整聚类中心,最终将网页聚成各主题下的不同子类别。  相似文献   

6.
Web文本聚类算法的分析比较   总被引:2,自引:0,他引:2  
随着计算机网络的发展,各种文本资源以惊人的速度增长,导致信息搜寻困难和信息利用率低下。而快速高质量的Web文本聚类技术可以满足用户方便快捷地从互联网获得所需要的信息资源。文章对Web文本聚类如网页采集、去噪、分词、特征表示等关键技术进行研究,对常用的Web文本聚类算法进行了分析比较,所给出的分析比较结果对文本聚类算法的应用有现实意义。  相似文献   

7.
为了解决基于传统关键词的文本聚类算法没有考虑特征关键词之间的相关性,而导致文本向量概念表达不够准确,提出基于概念向量的文本聚类算法TCBCV(Text Clustering Based on Concept Vector),采用HowNet的概念属性,并利用语义场密度和义原在概念树的权值选取合适的义原作为关键词的概念,实现关键词到概念的映射,不仅增加了文本之间的语义关系,而且降低了向量维度,将其应用于文本聚类,能够提高文本聚类效果。实验结果表明,该算法在文本聚类的准确率和召回率上都得到了较大的提高。  相似文献   

8.
基于Kolmogorov复杂性的聚类算法虽然具有普适性、参数无关性的优点,但是应用到文本内容语义信息聚类时往往准确率较低。针对这一问题,提出了一种基于特征扩展的文本聚类改进算法——DEF-KC算法。该算法通过引用百度百科中特定词条的信息,对预处理过的文本中的关键词进行特征扩展,从而提高特征词的主题贡献度,增强文本的结构辨识度,并通过选取特定压缩算法近似计算Kolmogorov复杂性得到文本相似度,最后使用谱聚类算法进行聚类。实验结果表明,与传统的基于Kolmogorov复杂性的文本聚类算法相比,使用该算法时聚类准确率和召回率均得到了较大提升。  相似文献   

9.
为了进一步提高图像检索系统的效率,提出了一种由谱聚类算法预处理的基于内容的图像检索方法.主要思想是在用户提出检索请求之前,利用谱聚类算法将初始图像库划分为若干子库;用户给出示例图片后,首先搜索与示例图片相似度最大的子库,再将搜索范围锁定在该子库内检索出与示例图片最相似的图片.实验表明,该方法在保持了较高查准率的同时,明显缩短了检索时间,提高了检索效率.  相似文献   

10.
提出一种在无标注图像库中进行的基于关键词的检索方法.该方法在用户输入关键词后,首先利用图像周围的文字信息从网页中过滤一部分与检索主题无关的图像.然后利用图像的视觉特征在之前的基础上筛选出与检索词具有高度相关性的图像.最后利用数据审计技术对筛选出的图像进行进一步精化,并利用精化后的图像对图像库进行检索.实验结果表明,借助数据审计技术,该方法可有效提高对无标注图像库进行基于关键词的检索性能.  相似文献   

11.
CBIR关键技术研究*   总被引:14,自引:2,他引:12  
从图像特征提取和图像特征匹配两个关键环节对目前的CBIR技术进行了细致的阐述,分析和比较了不同方法的原理及优缺点;分类研究了压缩域的图像检索技术;指出了CBIR的一些研究热点及发展方向。  相似文献   

12.
基于内容的图像检索中的相关反馈算法   总被引:3,自引:1,他引:3  
近几年,相关反馈算法作为解决图像检索问题行之有效的方法,受到人们越来越多的重视,各种各样的相关反馈算法层出不穷,该文回顾了早期的启发式相关反馈算法和近期的最优相关反馈算法,对现有的相关反馈算法进行了分析、总结和对比,并提出了今后相关反馈算法的发展方向。  相似文献   

13.
交互式图像检索中相关反馈进展研究   总被引:9,自引:0,他引:9  
在介绍现有的交互式图像检索机制的基础上,重点阐述和分析了交互式相关反馈技术及其进展;最后对图像检索技术的发展趋势进行了探讨。  相似文献   

14.
针对直方图无法反映色彩分布的空间信息这一缺陷,提出一种融合了空间及邻域信息的色彩直方图检索方法。以同一色彩构成的最大连通区域及其边缘区域的颜色粗糙度来反映同一颜色像素形成的区域特点及邻域信息,从而降低检索结果对色彩的绝对依赖,提高了检索的准确性。  相似文献   

15.
对国际上近来提出的保局投影(LPP)算法在图像检索中的最新应用研究进行了详细介绍;分析指明了几种基于LPP的图像检索算法的特点;设计并完成了基于LPP的图像检索算法图像检索效果的比较实验;最后根据实验结果总结了各类算法的优缺点。  相似文献   

16.
一种基于内容的图像检索界面   总被引:2,自引:0,他引:2  
基于内容和对象的图像压缩和检索是下一代的图像处理技术,具有较广阔的应用前景。目前该领域的研究主要从设计方便、快捷的用户查询界面和发展图像数据库检索技术两方面展开。为此,该文提出了一种基于内容的图像检索用户界面的设计方法来满足用户复杂的检索要求。在图像的检索过程中,通过用户组合图标的方法来描述检索要求,同时将图像的颜色和空间信息相结合进行图像查询,并借助用户的反馈信息实现系统的自学习功能,最终逐步提高系统图像检索的速度和准确性。  相似文献   

17.
针对基于内容的图像检索难于通用化的问题,使用MPEG-7的颜色布局描述符和平行纹理描述符建立联合特征空间,并采用遗传算法对其内部特征权重以及描述符之间的权重进行优化。实验结果表明,使用上述方法大大降低了系统检索时间,明显提高检索效率。  相似文献   

18.
在图像数据库中,如何有效检索和查询图像是一个重要的研究内容.文中提出一种结合组合欧拉向量与边缘方向直方图( EOH)的图像检索方法.首先,从边缘图像中提取组合欧拉向量特征进行图像检索(EEXO算法),其次,为更好地区分不同形状但欧拉特征相近的图像,将EEXO算法与EOH算法相结合提出EEXOEOH图像检索算法.实验结果表明,EEXOEOH算法与其它4种算法相比,具有较好的检索效率.  相似文献   

19.
中文Web文档库全文检索技术研究与实现   总被引:13,自引:0,他引:13  
全文检索是一种非常有效的信息检索技术,本文结合国家863项目《WWW文档协同写作系统》的设计与开发,研究对中文Web文档库实现全文检索的主要技术,着重讨论了字表法全文检索技术细节,最后介绍了一个实用的全文检索系统的实现。  相似文献   

20.
基于颜色空间分布特征的图像检索   总被引:3,自引:0,他引:3  
目前,基于颜色特征的图像检索大多是以图像的颜色直方图作为颜色特征,这种图像检索方法有简单高效的优点,但丢失了颜色的空间分布信息,该文从CT图像重建的理论中得到启发,将对一幅图像从几个方向的投影图作为这幅图像的颜色特征分布。为进一步减少检索时运算的数据量,对图像做小波分解,然后对分解后图像的低频子带做Radon变换得到颜色空间分布的特征向量,并根据这个特征进行检索,实验表明,当检索图像中有明显的颜色目标时,该方法比传统的颜色直方图法更精确,颜色空间性更强,而且检索用时更短。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号