首页 | 本学科首页   官方微博 | 高级检索  
     

基于主题词表和 FCA的网页语义概念树构建研究
引用本文:孙亚琳,赵林林,杨小平.基于主题词表和 FCA的网页语义概念树构建研究[J].计算机应用研究,2014(11).
作者姓名:孙亚琳  赵林林  杨小平
作者单位:1. 中国人民大学 信息学院,北京,100872
2. 中国地质调查局发展研究中心 信息工程室,北京,100037
基金项目:国家自然科学基金资助项目
摘    要:针对用户使用网站效率低和网站质量差的问题,提出了利用形式概念分析(FCA)来构建网页语义概念树的方法。该方法首先利用信息抽取、自然语言处理等技术对网页集进行文本抽取、分词,提取出描述文本语义的特征词;再以主题词表为参照,设计基于搜索引擎的词语相似度算法,将抽取的特征词全部转换成主题词表中主题词,对将抽取的语义信息转换成形式背景,利用规则、聚类等技术对形式背景进行约简。最后通过设计的建格算法构建概念格,实现概念树构建。实验结果表明,利用该方法构建的概念树可以作为网站本体模型的基础,对语义评估具有积极的意义,具有一定的应用价值和借鉴意义。

关 键 词:本体  语义概念树  形式概念分析    词语相似度

Research of Web semantic concept tree construction based on thesaurus and FCA
SUN Ya-lin,ZHAO Lin-lin,YANG Xiao-ping.Research of Web semantic concept tree construction based on thesaurus and FCA[J].Application Research of Computers,2014(11).
Authors:SUN Ya-lin  ZHAO Lin-lin  YANG Xiao-ping
Abstract:
Keywords:ontology  semantic concept tree  formal concept analysis  thesaurus  word similarity
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号