首页 | 本学科首页   官方微博 | 高级检索  
     

基于相似图片聚类的Web文本特征算法
引用本文:方爽,殷俊杰,徐武平.基于相似图片聚类的Web文本特征算法[J].计算机工程,2014(12).
作者姓名:方爽  殷俊杰  徐武平
作者单位:武汉大学计算机学院,武汉,430072
摘    要:对于图文不符的低质量网页,现有基于文本关键词的图片搜索引擎得到的结果相关性较差。针对该问题,将图片的相似性聚类信息和网页质量因素融入文本分析过程,提出一种基于相似图片聚类的Web文本特征算法。根据网页Page Rank值、关键词HTML标签类别和关键词词性类别的不同,分别赋予其不同的权重并代入计算公式,综合计算得到整个聚类中全部关键词的文本特征值,并通过设置阈值提取高相关文本。对随机选取的15个图片聚类进行实验分析,结果表明,与百度和谷歌目前所用图片搜索算法相比,该算法能够准确地找到反映图片内容的真实文本,提高图片检索的精度。

关 键 词:Web文本特征  图片搜索引擎  基于文本的图像检索  基于内容的图像检索  倒排索引  Web文本分析

Web Text Feature Algorithm Based on Similar Image Clustering
FANG Shuang,YIN Junjie,XU Wuping.Web Text Feature Algorithm Based on Similar Image Clustering[J].Computer Engineering,2014(12).
Authors:FANG Shuang  YIN Junjie  XU Wuping
Abstract:
Keywords:Web text feature  image search engine  Text-based Image Retrieval( TBIR)  Content-based Image Retrieval ( CBIR)  inverted index  Web text analysis
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号