首页 | 本学科首页   官方微博 | 高级检索  
     

基于关键词筛选分词算法的企业级搜索引擎
引用本文:吴亮,李树广.基于关键词筛选分词算法的企业级搜索引擎[J].微型电脑应用,2010,26(7):37-40.
作者姓名:吴亮  李树广
作者单位:上海交通大学,上海,200240
基金项目:上海电力电网系统重点攻关项目 
摘    要:随着计算机技术与数据库学科不断发展,数字化信息已经成为当今存储数数据的首要选择,并且借助大型搜索引擎,使用户可以快速找到对应信息。应用于企业级的高效搜索引擎成为当前研究的重要课题。本文提出了基于关键词筛选KWS(Key Word Selection)的搜索引擎机制,针对电网与大型发电厂智能管理系统的数据结构,通过构建双字哈希词典和双字耦合消歧分词与结果的语义筛选,将筛选后的分词结果放入Sphinx和MySQL数据库进行全文搜索并加以缓存,既提高了搜索速度又提高搜索的准确度。

关 键 词:企业级数据库  哈希结构  双字耦合  分词算法  缓存

Enterprise Search Engine Based on Keyword Selected Split-word Algorithm
Wu Liang,Li Shuguang.Enterprise Search Engine Based on Keyword Selected Split-word Algorithm[J].Microcomputer Applications,2010,26(7):37-40.
Authors:Wu Liang  Li Shuguang
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号