首页 | 本学科首页   官方微博 | 高级检索  
     

一种面向B2B垂直搜索的网页信息去噪方法
引用本文:崔阳,;吴爱华.一种面向B2B垂直搜索的网页信息去噪方法[J].微机发展,2008(12):70-73.
作者姓名:崔阳  ;吴爱华
作者单位:北京科技大学信息工程学院,九城网络技术集团有限公司
基金项目:国家自然科学基金(60675030)
摘    要:B2B垂直搜索引擎是垂直搜索引擎在电子商务领域的应用。怎样更好地对互联网中海量的企业产品信息进行抽取和去噪,是当前B2B垂直搜索引擎构建中所面临的重要问题。介绍了B2B垂直搜索引擎的特征;分析了一般企业网站的基本结构,在此基础上提出一种面向B2B垂直搜索引擎的企业站点产品信息去噪方法;给出了该方法的实验结果。使用这种方法抽取到的产品信息可用于指导产品进一步的分类工作。

关 键 词:B2B垂直搜索引擎  信息抽取  去噪  企业站点树

A Method of Eliminating Noisy Information in Web Pages Oriented B2B Vertical Searching
CUI Yang,WU Ai-hua.A Method of Eliminating Noisy Information in Web Pages Oriented B2B Vertical Searching[J].Microcomputer Development,2008(12):70-73.
Authors:CUI Yang    WU Ai-hua
Affiliation:CUI Yang1,2,WU Ai-hua2
Abstract:B2B vertical search engine is a kind of vertical searching engines and used for E-business.Now it is an important issue that how to eliminate noise and extract useful manufacture information from corporation websites.The characters of B2B vertical search engine is introduced briefly first,then the general structure of the corporation websites is analyzed,and a method of eliminating noisy information in corporation websites is proposed,at last the result of experiments is given.The information extracted by that method can help the manufacture classification.
Keywords:B2B vertical search engine  information extraction  noise elimination  corporation website tree
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号