首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
水产养殖过程中,水质环境、饲料、用药等信息是水产品追溯的重要信息,能有效的保障水产品质量安全.采集系 统中池塘基本信息、进排水、水质、底质、投入品、打样情况等不能自动采集的数据,由养殖人员、管理人员、科研人员,通过网页、移动设备等方式录入采集.温度、pH、ORP等水质参数,通过自动采集设备采集,投饵机和增氧机部分数据也通过自动采集设备采集.系统基本开发完成,正在海丰养殖场试用.  相似文献   

2.
通用互联网信息采集系统的设计与初步实现   总被引:7,自引:0,他引:7  
通过建立网页资源库,结合Spider技术、内容分析技术、引入用户数据项和替换抽取指令编辑器等,提供和定制可视化通用性较强的互联网信息采集系统,能定期自动跟踪相关网站或网页,进行比较分析、抽取、规整入库、分类等,从互联网上获取所需信息。  相似文献   

3.
阐述了一个采用条形码技术和Novell网络两项新技术而研制出的电影发行管理系统。该系统具有误操作基本没有,数据录入速度快、可自动识别录入、操作简便、信息多口共享、保密性强等特点,充分发挥了其条形码和网络技术自动采集和录入、信息资源集中管理与共享的特点。  相似文献   

4.
当前的网页重复信息抽取方法缺少信息分类步骤,导致传统方法存在抽取全面率低、重复信息比例高以及整体性能差的问题。于是提出基于模式识别算法的网页重复信息抽取方法。利用类间平衡因子和词频获取网页信息的互信息特征。在关联规则的基础上根据网页置信度向量化互信息特征,完成网页信息特征的提取。利用模式识别中的支持向量机对网页信息分类,优化惩罚函数,建立软间隔支持向量机分类器。计算不同类别网页信息的结构相似度和语义相似度,结合上述计算结果获得网页信息相似性,完成网页重复信息的抽取。仿真结果表明,所提方法的抽取全面率高、重复信息比例低,且整体应用性能好,实验结果表明所提方法具有理想的应用效果。  相似文献   

5.
互联网中存在着大量的重复网页,在进行信息检索或大规模网页采集时,网页去重是提高效率的关键之一。本文在研究"指纹"或特征码等网页去重算法的基础上,提出了一种基于编辑距离的网页去重算法,通过计算网页指纹序列的编辑距离得到网页之间的相似度。它克服了"指纹"或特征码这类算法没有兼顾网页正文结构的缺点,同时从网页内容和正文结构上进行比较,使得网页重复的判断更加准确。实验证明,该算法是有效的,去重的准确率和召回率都比较高。  相似文献   

6.
刘向阳  徐争  喻勇 《福建电脑》2013,(6):120-121,127
毕业生就业信息采集系统是为高校毕业生就业状况的统计分析而研发的。系统使用ASP做为前台开发技术,ACCESS做为后台数据库技术,由前台子系统和后台子系统构成。前台功能实现包括毕业生信息录入、毕业生信息浏览两大模块。后台子系统的功能实现包括毕业生信息管理、毕业生信息批量导入与导出、管理员管理三大模块。系统应用界面友好,运行稳定。  相似文献   

7.
这些年来,自动识别技术发展迅速,已经成为一种极为有效的数据采集手段。将自动识别技术运用到企业物流管理信息系统中去,不但可以实现信息的实时采集,还能有效地解决企业物流管理信息系统中信息录入的瓶颈问题,而且可以实现企业财务、人员、物料以及各个部门信息的无缝对接。需要注意的是,企业物流管理系统在应用自动识别技术应着重关注两个重要问题:一个是怎样选择合适的自动识别技术,另一个是在长期的实践过程中逐渐总结出来的数据采集解决方案,  相似文献   

8.
针对农业科技信息共享率低、分散分布等问题,应用Web信息抽取方法实现自动采集多源农业科技信息入库,采用XML文件实现失败重试机制。通过对日志文件进行处理,采用改进的k-means聚类方法建立用户访问模式,并得到访问模式的网页特征词及权重的集合,构建用户兴趣模型库,为来访会话推送网页。在实际应用中,定时更新用户模型库,从而保证了站点内容的及时性、推送服务的可靠性、可用性。  相似文献   

9.
深圳国税在对自身信息化建设进行深入调研时发现,数据集中工作目前存在着三大问题,一是数据质量不可靠,二是信息不能共享,三是信息缺乏有效监控。数据的不一致、不准确、不完整给业务工作带来了很多麻烦,例如纳税人的基本信息被分别保存在CTAIS、金税、银税联网、免抵退等多个不同的系统中,更新的时候难以保持一致;前台的录入错误传递到各个系统导致部分数据不准确;纳税人基本资料采集不完整,在推出新的应用系统时经常要重复采集,给业务人员和纳税人带来了额外的工作负担。信息不能共享的问题体现在两方面,首先是系统间的信息不能共享,例如金税和CTAIS目前不能共享增值税专用发票的明细信息,部分单机系统的数据无法共享;  相似文献   

10.
网络信息浩如烟海,其中不乏我们需要的资源。怎样才能方便快捷地将这些有用的信息分门别类地保存下来查询呢?正所谓集腋成裘,最好的方法当然是利用专门的网页资料采集工具来实现。我们将对目前流行的四款网络资源采集工具进行评测,希望能帮助朋友们从中找到适合自己的一款。  相似文献   

11.
基于HTML标记和长句提取的网页去重算法   总被引:1,自引:0,他引:1  
提出了一种高效的算法来去除互联网上的重复网页。该算法利用HTML标记过滤网页中的干扰信息,然后提取出能表征一张网页的长句作为网页的特征。通过分析两张网页所共享长句的数量,来判断两张网页是否重复。该算法还利用红黑树对网页的长句进行索引,从而把网页去重过程转换为一个搜索长句的过程,减小了算法的时间复杂度。实验结果表明该算法能够高效,准确地去除重复的网页。  相似文献   

12.
刘琪 《中国信息化》2009,(14):61-61
“数字社区”建设一直以来都成为各地信息化建设的重头戏,也呈现了百花齐放的局面。但是,随着国内经济社会发展进入至关重要的转型期,以及信息化建设的深入推进,“数字社区”建设需要面临新的发展挑战与机遇。例如,长期以来,基层管理由于条块分割等原因,建立了很多独特的业务管理和服务系统,设备重复配置,数据重复录入,造成了一个个信息孤岛,造成基层管理效率低、办事难等问题。  相似文献   

13.
用信息-摘要算法提高Web信息检索效率的研究   总被引:1,自引:0,他引:1  
杨文忠  章兢 《微机发展》2006,16(6):222-223
针对常用搜索引擎返回给用户的信息中包含大量重复网页的缺陷,提出了一种基于信息-摘要算法的去除重复网页算法。由于算法的成熟,该算法易实现,可移植性强。实验证明该算法能有效地去除常用搜索引擎返回的重复网页,从而为Internet用户提高信息检索效率,具有较强的实用价值。  相似文献   

14.
选择恰当的情报主题相关度预测策略,控制采集情报质量为企业的决策提供正确有效的素材是面向主题的情报采集的核心技术之一。单一依靠文本或链接的情报主题相关度预测策略,不能准确有效地预测待爬网页的价值。该文提出一种基于主题的PageRank算法—Focused PageRank算法来计算网页URL优先级。该方法考虑了页面内容的主题相关度以提高抓取页面的质量,通过网页链接关系预测网页的重要度以提高情报采集的覆盖率。从而提高情报采集的速度和效率,实现不同情报主题下页面URL优先级排序,适应企业竞争情报系统对多主题情报信息的采集。  相似文献   

15.
互联网信息定向采集系统的设计与实现   总被引:1,自引:0,他引:1  
本系统通过提供一个基于定制模板的下载机制,准确定位所需信息在网页HTML结构树中的位置,对网页的结构进行解析并下载指定位置的内容,提取准确而高效的信息,并且能定期自动跟踪相关网站或网页,进行比较分析、抽取和规整入库等,对互联网信息进行有针对性的定向采集,进而从互联网上获取所需信息。  相似文献   

16.
应用区块链技术对多式联运单证进行数字化升级,能够有效地解决当前多式联运单证中存在的内容重复填写、制作速度慢、信息共享难等问题.整合航空、公路、铁路和水路四种运输方式涉及的单证,形成多式联运数字化单证的主要内容;将传统多式联运单证的发货收据、运输合同、物权凭证、提货凭据等业务需求转化为数字化单证的信息录入、查询、授权、签注、签收等功能需求.开发智能合约在以太坊平台上进行实验,结果表明,多式联运数字化单证可以实现预设的所有用户功能,避免了内容重复填写、制作速度慢、信息共享难等问题,有利于提高物流效率、降低物流成本.  相似文献   

17.
用信息-摘要算法提高Web信息检索效率的研究   总被引:1,自引:0,他引:1  
针对常用搜索引擎返回给用户的信息中包含大量重复网页的缺陷,提出了一种基于信息-摘要算法的去除重复网页算法。由于算法的成熟,该算法易实现,可移植性强。实验证明该算法能有效地去除常用搜索引擎返回的重复网页,从而为Intenret用户提高信息检索效率,具有较强的实用价值。  相似文献   

18.
针对网络信息共享的需求和农业学科自身的特点,利用本体技术,提出基于网络农业信息分类编码的农业信息本体作为网页分类标识、数据库管理和搜索关键字推理的标准。拓展了传统搜索引擎的结构,结合Agent和Jena技术,构建了一个具有信息检索和自动归类的搜索与录入系统,使得系统更具智能化、人性化和专业化,有效地利用信息,提高了查全率和查准率。  相似文献   

19.
基于共享基础数据的信息系统集成方案   总被引:1,自引:0,他引:1  
为解决企业信息系统集成中跨系统数据访问难的问题,提出基于共享基础数据资源的企业信息基础设施建设的理论基础、整体框架和实施方案.通过分析企业各种应用系统中所涉及的共享基础数据,构建基于共享基础数据资源平台的企业信息系统整体框架,并简单介绍按此方法实施的一个企业信息化基础设施建设的实际例子.  相似文献   

20.
一些考试要求学校集中采集头像,以便制作相关证件和上传到管理系统。传统的方法是一张一张地拍摄,进行重命名,最后再根据学生的信息进行整合,非常繁琐。有没有一种方法,能在拍摄照片的同时,一步完成相片跟学生信息的对接呢?为了解决这个问题,我试用了多种软件,最终发现一款名为"自由照片采集系统"的软件很好用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号