期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

马安香张斌张引高克宁孙达明《小型微型计算机系统》2010,31(5)

Deep Web中蕴含了海量可供访问的信息,如何构建一个具有较好适用性和高效数据处理能力的Deep Web数据集成系统是有效利用Deep Web信息的关键.提出一种基于结果模式的Deep Web数据集成机制,通过结果模式可以实现高效的数据抽取,并且在结果模式的基础上可以根据用户查询请求动态生成结果输出模式,为高效的查询结果处理奠定了良好基础;同时,针对Deep Web数据源特点,给出数据源间冲突的分类及解决策略,为解决数据源间的异构问题奠定了良好基础. 相似文献

2.

面向多样化搜索背景的查询推荐策略

孙达明张斌张书波马安香《计算机研究与发展》2014,(Z1)

基于日志的搜索引擎查询推荐方法大多从流行性角度进行查询推荐,这种方式能够带来不错的推荐效果.然而,流行性行为代表群体用户共性的需求,所以这类推荐方法忽略了用户背景不同带来的搜索需求的差异,当小团体用户的搜索需求与流行性需求不一致时,往往造成小团体搜索需求无法被满足,进而导致针对此类用户的推荐失败.而且,在搜索引擎领域,用户信息难以获取,提供个性化推荐服务也比较困难.为了减少推荐失败的风险,提高查询推荐质量,提出一种折衷的解决方案,面向多样化搜索背景的查询推荐策略.在查询流图的基础上构造密集行为块,通过密集行为块表示用户特征,从而构建典型用户行为模型,并以典型用户行为区分用户背景.另外,还提出了面向多样化搜索背景的查询推荐方法,当搜索词面临多种用户背景时,推荐系统提供多样化的推荐词集合,最后,在真实数据集的实验结果证明了本策略能够在较小程度降低准确度的同时降低推荐失败的风险. 相似文献

3.

基于重复模式的Web信息语义表示方法的研究

高克宁马安香张斌魏宏儒《小型微型计算机系统》2009,30(1)

根据Web页面中出现的重复信息对Web页所体现的语义进行表示,可以提高Web页分类正确的精度.基于这一思想,本文通过对传统重复模式表示法的分析,提出基于重复模式的Web信息语义表示法.该方法在形式化描述重复模式的基础上,抽取Web信息中的重复模式建立表达Web信息语义特征的相关矩阵,并通过γ相似匹配算法计算重复模式的权重继而进行Web信息分类.实验证明,采用基于重复模式的Web信息语义表示法能够较好的体现Web网页信息的主题特征,可以提高Web信息分类的准确率. 相似文献

4.

基于结果模式的Deep Web数据抽取 总被引：3，自引：0，他引：3

马安香张斌高克宁齐鹏张引《计算机研究与发展》2009,46(2)

高效、准确地获取Deep Web数据是实现Deep Web数据集成系统的关键问题,然而重复语义标注、嵌套属性的存在是Deep web数据抽取效率和准确率难以提升的瓶颈问题.因此提出基于结果模式的Deep Web数据抽取机制,将数据抽取工作分为结果模式生成和数据抽取两个阶段,属性语义标注放在结果模式生成阶段来完成,有效解决了重复语义标注问题;同时针对嵌套属性问题,提出一种有效的解决方法.与同类成果相比,基于结果模式的数据抽取方法提高了数据抽取的准确率及效率,并且为Deep Web数据集成奠定了良好的基础. 相似文献

5.

支持Web信息分类的高性能蜘蛛程序 总被引：1，自引：0，他引：1

高克宁柴桥子张斌马安香《小型微型计算机系统》2006,27(7):1308-1312

随着Web信息的快速增长，如何提高信息检索的准确率，如何展示检索结果，成为Web信息检索的重点研究内容,本文设计一种新的蜘蛛程序T—Spider，采用分布式两级并行控制，在获取Web信息的同时，获取网站结构，从而支持基于网站结构的信息分类．相似文献