排序方式: 共有100条查询结果,搜索用时 15 毫秒
91.
自然语言词汇的语义相关度的计算需要获取大量的背景知识,而维基百科是当前规模最大的百科全书,其不仅是一个规模巨大的语料库,而且还是一个包含了大量人类背景知识和语义关系的知识库,研究表明,其是进行语义计算的理想资源,本文提出了一种将维基百科的链接结构和分类体系相结合计算中文词汇语义相关度的算法,算法只利用了维基百科的链接结构和分类体系,无需进行复杂的文本处理,计算所需的开销较小.在多个人工评测的数据集上的实验结果显示,获得了比单独使用链接结构或分类体系的算法更好的效果,在最好的情况下,Spearman相关系数提高了30.96%. 相似文献
92.
93.
94.
查询扩展是一种改善信息检索召回率的重要技术。该文根据维基百科和搜索引擎各自的优点来实现查询词的扩展,试图提高检索结果top N的准确率。由于维基百科篇章中存在着大量的超链接,这些超链接中包含着与主题紧密相关的词条,通过提取这些词条,来实现基于维基百科的扩展。实验基于搜索引擎伪相关反馈的查询扩展作为baseline,分别对单语扩展系统和中英文跨语言扩展系统进行检测。实验结果表明本文的方法相比baseline系统,单语系统中MAP值提高6.41%,跨语言系统中Top10-precision值提高10.90%。 相似文献
95.
96.
针对传统人工编辑导致大量类别信息重复和不规范的问题,提出了应用协同过滤技术为中文维基百科文章自动推荐类别。利用中文维基百科中的四个重要语义特征即链入、链出、链入的类别和链出的类别来表示维基百科文章,得到与目标文章相似的前若干篇文章的所有类别后,通过查询返回的相似度值计算各个类别的权重,选择前面的若干个类别作为推荐结果返回给目标文章。实验结果表明了这四个语义特征能较好地表征一篇维基百科文章,同时也验证了协同过滤方法在中文维基百科自动推荐类别中的有效性。 相似文献
97.
数据为基大数据是社会信息化的产物,多大才算大数据?根据维基百科的定义,大数据的大小是从TB级别到PB级别,1PB=1024TB,1TB=1024GB。也就是说,我们现在常规使用的电子设备,像智能手机、平板电脑的顶级配置(512G)的2048倍才刚刚达到大数据的入门级别。而大数据不止于大,更在于数据结构的多样。 相似文献
98.
99.
查询扩展是一种改善信息检索召回率的重要技术。该文根据维基百科和搜索引擎各自的优点来实现查询词的扩展,试图提高检索结果top N的准确率。由于维基百科篇章中存在着大量的超链接,这些超链接中包含着与主题紧密相关的词条,通过提取这些词条,来实现基于维基百科的扩展。实验基于搜索引擎伪相关反馈的查询扩展作为baseline,分别对单语扩展系统和中英文跨语言扩展系统进行检测。实验结果表明本文的方法相比baseline系统,单语系统中MAP值提高6.41%,跨语言系统中Top10-precision值提高10.90%。 相似文献
100.
《国际纺织品流行趋势》2015,(3):232-243
极致普通风格(normcore)对你而言意味着什么?我们知道这个术语是由流行趋势预测机构K-Hole炮制,并由"普通"(normal)和"硬核"(hardcore)两个词合成的,然而每个人眼中都有一个属于他自己的"normcore"。维基百科对这个词的定义是,一种"中性的流行趋势,以低调的大众化外观为特征"。对我们而言,极致普通风格则是一种故意以不时 相似文献