排序方式: 共有97条查询结果,搜索用时 20 毫秒
41.
42.
43.
44.
语义相关度计算在信息检索、词义消歧、自动文摘、拼写校正等自然语言处理中均扮演着重要的角色。该文采用基于维基百科的显性语义分析方法计算汉语词语之间的语义相关度。基于中文维基百科,将词表示为带权重的概念向量,进而将词之间相关度的计算转化为相应的概念向量的比较。进一步,引入页面的先验概率,利用维基百科页面之间的链接信息对概念向量各分量的值进行修正。实验结果表明,使用该方法计算汉语语义相关度,与人工标注标准的斯皮尔曼等级相关系数可以达到0.52,显著改善了相关度计算的结果。 相似文献
45.
针对自然语言处理中的中文命名实体消歧问题,提出一种基于异构知识库的层次聚类方法。利用中文信息抽取系统对中文维基百科等知识库进行抽取,形成包含人物信息、实体关系的实体信息对象,并在Hadoop平台上用分布式计算进行层次聚类,研究人物实体特征的选取和维基百科等知识库的使用对命名实体消歧结果的影响。结果表明加入百科知识库后,F值从91.33%增加到了92.68%。 相似文献
46.
该文提出了基于维基百科类别体系的文本特征表示方法,方法是将文本中的词映射到维基百科的类别体系中,使用类别作为特征来对文本进行表示。基于维基类别的文本特征表示方法可以增强文本特征表示能力,降低文本特征空间维数。针对维基百科条目在语料中覆盖度不足的问题,该文提出了一种基于全局信息自学习维基百科类别的方法。该文构造基于维基百科类别为文本表示的分类系统,实验结果证明,基于维基百科类别作为文本表示特征,相对于词袋模型,具有明显的降维效果,在当特征数量较少时(如:<700),分类的F1值提高了5.14%。 相似文献
47.
48.
基于明确语义分析的自动文摘算法 总被引:2,自引:0,他引:2
不同于传统采用统计学习方式的自动文摘算法,利用维基百科等知识密集的资源建立概念空间,在该空间中对词语进行语义解释,进而解释词语及文本片段的语义,由此提出一种基于明确语义分析的自动文摘算法。实验结果证明,相比传统算法,该算法精度更高,用更少的句子即可获得更高的信息覆盖率。 相似文献
49.
为解决UDDI中传统分类系统分类粒度过、维护困难等问题,提出了一种基于Folksonomy的Web服务发现模型,并时模型的具体实现方案进行了详细探讨.分析了Folksonomy机制本身的缺陷,并利用维基百科和WordNet进行了一系列改进.利用程序模拟了协作标签系统环境,并进行了模拟实验.实验结果表明,该机制能实现更为高效的Web服务分类检索,针时Folksonomy改进措施对提高查全率和查准率具有积极作用. 相似文献
50.
社会网络分析是研究社会关系的一种新兴的研究方法,它能够对社会网络中行为者之间的关系进行量化分析,以可视化的图形展示行为者之间的深层次关系及描述群体关系的结构.基于维基百科抽取信息,建立辞典,然后构建了计算机网络技术关联网络、相关科研人员人际关系网络以及计算机网络技术与科学家关系网络三个社会网络,并对这三个网络用社会网络分析方法进行研究.发现搜集的当今80位在计算机领域有杰出贡献和影响力的科学家中很大一部分并不处于核心地位,说明他们与其他科学家合作的次数较少.而某些计算机网络技术其子技术或分支较少,但是其发展空间比较大,有可能成为未来的“热门”. 相似文献