首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
网页与广告关联是基于网页内容的网络广告的核心技术,本文提出了一种基于语义的、以实现网页和广告精确匹配为目标的广告推介方法。首先对一个Web网页进行主题信息提取,获得网页的主题词;然后再对这些主题词语作同义词扩展、上位词扩展、下位词扩展和相关词扩展,最后从待匹配的广告中选择匹配度最高的广告。对该方法进行了模型系统实现并进行了测试运行, 结果表明该方法是行之有效的。  相似文献   

2.
刘海旭  郑岩 《软件》2012,33(12)
社会化标签正被广泛的应用在网页文本的描述和分类方面,能够直接反映用户兴趣和商品特征,因而可用于个性化推荐系统中.在进行标签推荐时,需要考虑到标签间的关联度,而现有的标签关联度算法都是基于标签之间的共现关系或者直接基于语义词典,这些算法未考虑到标签与资源的相关性和资源与资源的相关性.本文提出了基于语义的标签关联算法,首先通过潜层狄利克雷分配模型和向量空间模型求得资源间的相关度,然后通过概率模型求得标签与资源的相关度,最后求得标签间的关联度.实验结果表明:基于语义的标签关联算法能够有效的提升社会化标签推荐系统的性能,与语义词典在语义上基本一致且能够实现语义词典未登录词的关联.  相似文献   

3.
在领域主题爬虫中,为提高网页爬取的效率和准确性,将扩展主题特征库(extended topic feature library,ETFL)引入进爬虫的网页过滤算法中。将网页抽象为标签块节点集,通过主题特征库扩展算法对静态特征项进行扩充生成扩展主题特征库,利用网页主题特征项提取算法从页面中抽取出特征项,在爬虫抓取网页的过程中,通过基于扩展主题特征库的网页相关性判断方法对页面进行过滤。该算法弥补了传统的基于静态关键词项的网页过滤算法对页面语义层次处理的缺失。实际项目运行结果表明,在领域主题爬虫中引入扩展主题库能够有效提高网页抓取精度,具有较高可用性。  相似文献   

4.
大多数利用标签与用户和项目之间关系的推荐算法,都要面临用户个体不同所导致的标签稀疏问题,不同的用户为项目所标注的标签会有所不同.针对由于用户标注标签的随意性而导致的用户标签和项目标签矩阵稀疏问题,提出了一种标签扩展的协同过滤推荐算法.该算法根据用户标注标签的行为计算基于标签的标签相似度,根据用户标注的标签语义计算基于标签语义的标签相似度,从用户行为和标签语义2个方面评估标签的相似度,并利用标签相似度来扩展每个项目标签,降低由项目与标签的关联关系产生的矩阵稀疏度.在M ovieLens数据集上的实验结果表明,所提算法在精度上有所提高.  相似文献   

5.
由于标注过程简单,Web上标注系统的使用逐渐增长,但是,随意定义的标签缺少标准并且语义模糊.为改善标签系统推荐效果,帮助用户组织、管理及分享网络资源,提高检索效果.提出基于用户标注信息的本体学习方法,针对不同映射情况,设计对应的本体学习模型和语义歧义消除模型,通过基于本体表示标签的语义信息和基于扩展本体语义关系的标签排序方法推荐标签.实验证明,召回率和精度都有提高,方法具有较好的可行性.  相似文献   

6.
本文提出了一种改进的基于语义的义素相似度,并从理论上分析参数β值的影响效果。在这个基础上,提出一种基于义素的词相似度,从语义上去匹配新名词和旧名词。在基于义素的词相似度基础上,提出一种网页信息项的语义匹配方法,来识别网页信息项的类别。实验结果表明,基于义素相似度的网页信息项语义匹配方法具有较好的匹配效果。  相似文献   

7.
标签抽取和匹配是查询接口理解的重要组成部分。提出了一种基于视觉的标签抽取和匹配方法,深入分析了相关匹配因子,给出了一种对查询接口表单进行重构的方法,它能依据接口HTMI_源代码自动还原出该表单的视觉布局特征。在最终的匹配算法中,综合考虑了基于label标记的匹配、基于文本语义的匹配以及基于位置特征的匹配。在8个领域共计277个查询接口上的实验证明了所提方法能取得较高的匹配精度。  相似文献   

8.
主题网页标签树邻接矩阵识别算法研究   总被引:1,自引:0,他引:1  
随着Web编程技术的发展,同类主题网页可以采用不同的Html标签展示出视觉特征相同的网页信息,导致需要匹配Html标签名称的现有网页结构相似性算法无法准确识别同类主题网页。因此,提出一种主题网页标签树邻接矩阵识别算法,通过构造主题网页标签树邻接矩阵,并利用邻接矩阵的结构特征来计算网页之间的结构相似度以实现同类主题网页识别。实验结果表明,该算法的最佳性能达到查全率100%、查准率96%,平均性能达到查全率97%、查准率89%。  相似文献   

9.
微博用户利用标签信息表征其兴趣及属性,通过分析微博用户标签特点以及现有微博推荐方法的局限性,提出一种改进的基于多标签语义关联关系的微博兴趣建模方法。为了解决现有加标方法忽略了语义关联及多标签间关联的问题,首先通过计算标签对在微博用户集合中的共现频率得到标签对语义内联关系;其次构建由标签对连接词组成的路径,通过共享熵进一步计算标签对语义外联关系;最后将两者结合得到标签对语义关联关系矩阵,由此来对用户 标签矩阵进行更新,得到基于多标签语义关联关系的微博用户兴趣模型。以新浪微博公开API抓取的大量微博信息作为实验数据,进行了一系列的实验和分析,结果表明本文构建的用户兴趣模型具有较好的性能。  相似文献   

10.
Web信息抽取中需要对目标网站的网页进行聚类分析,以检测并生成信息抽取所需的模板。传统的基于DOM树编辑距离的网页聚类算法不适合文档对象模型(DOM)树结构复杂的动态模板网页,提出了一种基于局部标签树匹配的改进网页聚类算法,利用标签树中模板节点和非模板节点的层次差异性,根据节点对布局影响的大小赋予节点不同的匹配权值,使用局部树匹配完成对网页结构相似性的有效计算。实验结果表明,改进的算法较传统的基于DOM树编辑距离的网页聚类算法,在对采用模板生成的动态网页进行聚类分析时具有更高的准确率,且时间复杂度低。  相似文献   

11.
围绕网页的头部内容展开,介绍了网页标题title标记、基址base标记、链接文件的link标记等相关知识。通过对每个标记的详细介绍说明了网页头部内容的重要性,它和网页的主体一样发挥着重要的作用。  相似文献   

12.
文章主要以开发中文视频语义测试集为目的,提出了一种视频语义标注模型,分析了标注中使用的本体,提出了一种方便易用的标注方法,并以此为基础开发了视频语义标注系统。系统采用RIA技术进行开发,可以更好的进行信息的共享,通过对标注进行的反复检查、确保正确率。  相似文献   

13.
针对人物标签推荐中多样性及推荐标签质量问题,该文提出了一种融合个性化与多样性的人物标签推荐方法。该方法使用主题模型对用户关注对象建模,通过聚类分析把具有相似言论的对象划分到同一类簇;然后对每个类簇的标签进行冗余处理,并选取代表性标签;最后对不同类簇中的标签融合排序,以获取Top-K个标签推荐给用户。实验结果表明,与已有推荐方法相比,该方法在反映用户兴趣爱好的同时,能显著提高标签推荐质量和推荐结果的多样性。  相似文献   

14.
基于音乐语义标签的音乐相似计算研究是音乐信息检索领域的另一个新的热点。该文提出一种基于标签挖掘的歌曲分类方法,以Last.fm音乐网站上的用户标签为特征进行歌曲相似性研究。文中将文本聚类中常用的潜在语义分析(LSA)方法和改进的K-means聚类方法相结合,应用于音乐语义标签的自动抽取;从音乐网站last.fm上抽取了6大类600首歌曲的8000多个用户标签作为音乐语义特征,并利用LSA进行歌曲向量的降维,形成了一个表示歌曲间相似关系的600×150维向量矩阵。最后利用K均值,根据音乐歌曲间的相似度进行歌曲分类,完成歌曲相似性比较。实验结果同没有LSA降维前及已有的HCC结果比较表明,使用文中提出的基于音乐标签的模型对歌曲进行分类,能得到较好的分类效果。  相似文献   

15.
扩展UDDI以支持OWL-S   总被引:2,自引:0,他引:2  
在对UDDI和OWL-S研究的基础上,提出扩展UDDI,以支持用OWL-S描述的Web服务的推广和请求,OWL-S可以通过服务提供功能的语义信息来描述服务,以实现更好的服务发现。而且,也提出了一种基于服务的输入输出描述本体的匹配机制。通过扩展JUDDI实现了OWL-S信息的存储和匹配机制。实验证明这是实现语义Web服务注册和发现的一种合理机制。  相似文献   

16.
标签云作为一种可视化导航接口在网络上愈加流行,云中标签可视化属性可以对用户浏览产生一定的导向作用,从而把用户的关注点吸引到特定字段或区域。但是目前,研究人员对标签云属性的导向作用知之甚少。文章围绕不同的标签云可视化布局对用户浏览的影响程度进行研究,通过标签有无背景颜色、标签密集程度、用户对标签的熟悉程度、标签背景颜色亮暗等实验,分析不同的可视化属性对用户的影响程度。在今后的标签云设计中可以根据不同人群有针对性地改变权重高的特性,使用户在标签云交互中具有导向性和高效、完美的体验效果。  相似文献   

17.
大量上传的网络图像因用户语义标注的随意性,造成了图像标签的不完备,大大降低了图像检索的效率.低秩稀疏是一种有效降低数据噪声的方法.为提高图像语义标签完备的准确度,提出一种基于低秩稀疏分解优化(LRSDO)的图像标签完备方法.首先结合待完备图像的视觉特征和语义搜索其近邻图像集;然后通过低秩稀疏分解模型获得其视觉特征与语义之间的映射关系,并以此预测该图像的候选标签;最后使用面向个体的标签共现频率方法对候选标签进行去噪优化,进而实现对其更加准确的自动图像标签完备.在基准数据集Corel5K和真实数据集Flickr30Concepts上进行了实验,结果表明,该方法在图像标签完备的平均准确率,平均召回率和覆盖率上均表现出更优的性能.  相似文献   

18.
扩展标记作为JSP页面功能扩展的核心技术,大大增加了JSP应用的灵活性。本文结合其在工程中的具体应用,详细介绍了扩展标记的理论知识和具体的创作过程,并在此基础上进行了扩展标记其他应用的研究。  相似文献   

19.
在Web页面常用到表格这种元素。本文提出一种根据表格语义来进行信息抽取方法。首先提出了一种短语语义相似度的度量方法,然后利用短语语义的相似度确定表格标题行(列),并对表格行(列)与抽取字段的对应关系进行计算,最后计算表格的整体语义,度量该表格与所要抽取的内容有多大相关度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号