排序方式: 共有13条查询结果,搜索用时 15 毫秒
2.
PageRank是Web结构挖掘的经典算法,已在Google搜索引擎中取得了巨大成功.但其迭代次数多,时空消耗大,执行速度和收敛速度都还较慢.文中详细讨论了Hadoop-MapReduce的执行流程及其内部实现机制后,提出了一种并行MapReduce实现矩阵分块的PageRank算法,其实质是减少MapReduce框架结构中Map阶段和Reduce阶段的迭代次数,从而减少时空开销.最后搭建Hadoop-MapReduce开源平台,模拟Web结构爬取,比较了传统算法和改进算法的性能.结果表明,改进后的算法迭代次数低,并行效率较高,在模拟环境中PgeRank标识网页等级显示其优越性. 相似文献
3.
中文分词是白然语言处理的前提和基础,利用基于字分类的方法实现中文分词,就是将中文分词想象成字分类的过程.把字放入向前向后相邻两个字这样的一个语境下根据互信息统计将字分成四种类别,即跟它前面结合的字,跟它后面结合的字,跟它前后结合的字,独立的字.在分词的过程中采用了t-测试算法,一定程度上解决了歧义问题.以人民日报为语料库进行训练和测试,实验结果表明,该方法能够很好地处理歧义问题,分词的正确率达到了90.3%,有了明显的提高. 相似文献
4.
MapReduce是Google开发的一种并行分布式计算模型,已在搜索和处理海量数据领域得到了广泛的应用.此模型只适用于数据关联性弱、能够高度并行化的程序,未能处理数据关联性强的数据(比如树形结构).文中详细讨论了MapReduce的实现机制,提出了一种基于树结构的MapReduce模型,它是基于一种聚类聚合的反复轮询过程,聚合时用<k1,k2,…,kn,value>代替传统的<k,value>,使模型更具有一般性.最后搭建Hadoop平台来处理XML结构的海量数据,并比对新旧两种模型的效率.实验结果表明,其执行速度明显比传统模型高效. 相似文献
5.
本在线考试系统采用ASP.NET+C#技术,选用微软的SQL Server2005作为数据库系统,利用.NET提供的ADO.NET数据访问技术;基于B/S模式的设计思想,便于系统扩充应用和升级维护,用Internet访问Web页面,实现网络组卷、在线考试、网上评分、在线统计等功能。 相似文献
6.
随着中国改革开放的不断深入和社会经济的持续发展,各种社会矛盾逐渐复杂化和多样化,社会治安面临空前的挑战。基于社会治安情况的历史数据,对未来一段时期内的治安状况做出科学的预测,将使治安管理工作事半功倍。数据挖掘是指从大量数据中挖掘出有趣的模式和规则,并根据挖掘结果做出科学的判断或预测的技术。目前,在社会治安状态预测方面的研究报道还很少,预测结果的准确率也始终困扰着我们,研究一种新颖的、高准确率的预测方法是我们的共同期待。据此, 提出 一种基于滑动窗口模式匹配的加权预测方法,大量的实验以及实际应用的结果表明,该算法具有简单、稳定、高准确率等特点。 相似文献
7.
介绍了以直角坐标机器人为基础的通用型液体样品自动采样系统的设计。给出了机器人的机械构型以及硬件接口逻辑和软件模块,该系统适用于大批量要产吕的常规分析,也可与现有的分析仪器配合使用。 相似文献
8.
9.
通过分析传统Web开发的不足,针对当前大多数家庭的实际需求,本文给出家庭理财系统的功能模块,基于ExtJS+Struts2的B/S架构,后台用XML作为数据库来持久化数据,阐述基于ExtJS与XML的家庭理财系统的设计与实现,从而实现系统的高效率运行。 相似文献
10.