排序方式: 共有57条查询结果,搜索用时 15 毫秒
1.
从Web中快速、准确地检索出所需信息的迫切需求催生了专业搜索引擎技术.在专业搜索引擎中,网络爬虫(Crawler)负责在Web上搜集特定专业领域的信息,是专业搜索引擎的重要核心部件.该文对中文专业网页的爬取问题进行了研究,基于KL距离验证了网页内容与链接前后文在分布上的差异,在此基础上提出了以链接锚文本及其前后文为特征、Naive Bayes分类器制导的中文专业网页爬取算法,设计了自动获取带链接类标的训练数据的算法.以金融专业网页的爬取为例,分别对所提出的算法进行了离线和在线测试,结果表明,Naive Bayes分类器制导的网络爬虫可以达到近90%的专业网页收割率. 相似文献
2.
从Web中快速、准确地检索出所需信息的迫切需求催生了专业搜索引擎技术。在专业搜索引擎中,网络爬虫(Crawler)负责在Web上搜集特定专业领域的信息,是专业搜索引擎的重要核心部件。该文对中文专业网页的爬取问题进行了研究,基于KL距离验证了网页内容与链接前后文在分布上的差异,在此基础上提出了以链接锚文本及其前后文为特征、Nave Bayes分类器制导的中文专业网页爬取算法,设计了自动获取带链接类标的训练数据的算法。以金融专业网页的爬取为例,分别对所提出的算法进行了离线和在线测试,结果表明,Nave Bayes分类器制导的网络爬虫可以达到近90%的专业网页收割率。 相似文献
3.
随着互联网的普及和网页数量的飞速增长,搜索引擎已经成为从网上获取信息的首选工具.然而,目前主流的搜索引擎在响应用户提交的检索请求时,往往以较长的一维列表形式分页展示结果,为了找到自己所需要的信息,用户必须对该结果列表进行耐心的浏览.为了进一步提高用户获取信息的效率和质量,减轻用户的劳动强度,研究者提出了对检索结果进行再挖掘、再组织的问题,聚类就是其中的研究热点之一.本文在分析现有检索结果聚类算法存在的问题的基础上,提出了基于查询相关性分析的标签驱动聚类算法,该算法通过分析短语与查询项的关联程度,提取作为候选簇标签的短语,然后根据这些标签确定网页摘要隶属的候选簇,最后基于对候选簇和标签的评价进行簇筛选和归并,得到聚类结果及每个簇的标签.在相同环境下进行的对比实验表明,所提出的算法优于相关工作,而且需要更少的信息资源支持. 相似文献
4.
现有非正交多址接入技术中,用户分组算法的实现首先对信道相似度门限值进行判断,选出候选成组用户;进而对候选成组用户的信道增益差进行比较,选出最优的成组用户。然而,上述分步求解算法中信道相似度门限值的设置存在一定的随机性,导致候选成组用户的选取不准确,从而影响分组结果,限制系统性能的提升。针对上述问题,提出利用对称矩阵的用户分组算法,对用户信道相似度进行非线性变换,而后将用户信道相似度和增益差线性求和构建成新的信道信息矩阵,进一步利用该矩阵的对称性进行求解。仿真分析表明该方法分组结果比设置门限的传统方法更优,在不同用户数目时系统容量均得到提升。在传统方法门限值为0.95时,所提算法系统容量在用户数为16时提升了13.4 Mb/s。 相似文献
5.
在信息网络科技高速发展的背景下,以对等网络技术(P2P)为主导的软件开发方兴未艾,这类软件深受广大网民的喜爱,而且用户呈逐年增多的趋势。本文主要介绍JXTA技术和P2P网络模型,研究以P2P网络结构为基础构建起的实时通信系统,对系统之中各个部位功能的实现做一番细致的论述。 相似文献
6.
于中华 《建筑·建材·装饰》2015,(3)
“办公建筑是二十世纪最伟大的标志之一。在各城市是办公楼的塔尖勾画出了城市的天际线。作为繁荣、进步、技术最常见的标志,办公建筑已经成为这个世纪世界运转状态的象征”。通过解读现代办公楼设计的几个关键问题,结合机场管理楼的建筑功能、造型设计、室内空间、技术设计以及管线综合等的介绍,对现代办公楼的设计进行了简要阐述。机场管理楼独特的色彩和形式显示其不凡的魅力,如果把T3航站楼喻为金色的交响乐,管理楼无疑是T3航站楼的序曲。 相似文献
7.
8.
根据专业搜索引擎的特点,提出了一种新颖的基于词语共现与HITS算法的查询推荐算法QR-CH(Query Recommendation algorithm based on word Co-occurrence and HITS algorithm)。该算法一方面利用HITS算法对基于词语共现筛选出的关联词按语义关联性进行排序,选取排序靠前的关联词作为推荐词,提高了推荐词与原查询词的相关性;另一方面使用HITS算法排序关联文档,从查询结果文档集的角度来判断推荐是否冗余,降低了推荐词的冗余性。该算法将推荐相关的信息存储到知识树中,利用知识树实现查询推荐。实验结果表明QR-CH算法在推荐词的相关性和冗余词的判断方面均优于文献中已有的类似算法。 相似文献
9.
基因表达式编程(GEP)是一种基因型和表现型相分离的进化新模型,为了挖掘紧致的函数关系,分析了进化系统各因素对挖掘紧致函数的影响,提出了带紧致压力的适应度函数来进化函数紧致解。实验表明,带有紧致压力的适应度函数能自动进化计算机程序,适合挖掘的紧致关系,在挖掘紧致函数中,朴素基因表达式编程(NGEP)比GEP提高效率21.7%,与不带压力的系统相比,GEP的平均压缩了31.2%,NGEP系统平均压缩了42.5%;NGEP较GEP更容易发现紧致解,且函数表达形式更容易理解,丰富了NGEP理论. 相似文献
10.