首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
目前传统的数字化地籍测量信息提取方法通过对地籍信息进行编码,实现对地籍信息的提取。由于缺乏对主要特征数据的提取,导致提取效率较低。对此,文章提出基于点云数据的地籍测量信息提取方法。利用三维扫描仪扫描地籍信息,获取点云数据,提取出双阈值点云特征数据。对点云数据进行降噪拼接处理,得到完整的地籍测量信息。在实验中,对构建出的地籍测量信息提取方法进行了提取效率的验证。经实验分析证明,利用提出的地籍测量信息提取方法对不同地籍模型进行信息提取,其耗费的提取时间较短,具备较高的提取效率。  相似文献   

2.
通过网络搜索人们可以获得各种形式的人物资料。文中针对学者研究如何从获得的资料中提取特征信息,提出一种基于领域知识的特征信息提取方法。该方法首先调用Google Search API实时采集网页上的人物信息,然后使用网页结构分析、触发词识别、自然语言处理等技术进行人物属性信息提取,最后自动生成并呈现一个标准化的学者简历。依据这一方法,作者设计并实施了一个学者特征信息的提取系统。  相似文献   

3.
以地外行星飞行器着陆区目标地形粗糙度和坡度作为主要研究内容,提出了对地形高程数据预处理,再进行地形特征信息提取的算法,并实现了相应的地形特征信息的提取.分析了基于双线性插值算法的高程数据重采样的基本原理;研究了地形坡度与粗糙度提取算法,并建立了相应的数学模型;应用某数字地形进行仿真验算,证明了基于高程数据的地形信息提取方法的可行性;为精确识别目标地形信息并对地形进行风险评估提出了一种新的研究思路.  相似文献   

4.
针对遥感图像信息提取过程中,因训练样本过大而导致提取结果不精准的问题,提出了基于人工智能的无人机测绘遥感图像信息提取方法。根据每一张图像数据的归一化指数构建图像信息提取模型;采用人工智能的机器学习卷积过程对图像信息进行降维处理;融合图像特征,获取概率特征图,构建目标相对优属度矩阵,共享卷积过程中的权值,实时更新机器学习的判别参数。使机器学习过程与判别过程平衡,将卷积得到的特征图连接起来作为判别依据,判别图像真假,由此提取图像真实信息。引入一个模型复杂性惩罚项,控制训练样本数量,实现无人机测绘遥感图像信息提取。实验结果表明,所提方法提取精度最高为0.93,损失程度最高为0.22,该方法信息提取精准度较高。  相似文献   

5.
建筑高度信息提取是高分辨率卫星遥感获取城市空间信息的热点问题之一。为了实现建筑物高度信息的高精度提取,提出了一种基于 规则信息的面向对象的建筑物高度反演方法。首先根据建筑物阴影几何、纹理、和光谱特征建立基于规则信息的建筑物阴影 提取算法,进行建筑物阴影信息提取,再通过计算像元平均值算出阴影长度,构建卫星、太阳、建筑物和其阴影的空间模型反演 建筑物高度。采用扬州市两个实验区(佳家花园和杉湾小区)的高分二号卫星遥感数据进行高度反演试验,通过对反演小区的105栋 建筑物实际高度测量,对反演结果验证,总体精度为96.5%。表明该方法在城市建筑物高度信息提取方面具有较高的精度。  相似文献   

6.
《信息技术》2019,(7):142-145
针对于互联网商品信息数据量庞大的问题,提出一种基于改进型轻量级语义特征提取的web商品信息挖掘方法。首先,通过分析网站链接的层级关系,采用层次访问的方式抓取电子商店的网站URL。其次,采用改进型轻量级语义特征提取方法对元素进行聚类以实现电子商店页面内商品记录的提取。最后,利用产品属性格式和产品记录结构的常识信息进行正则匹配,实现商品属性的提取。实验采用该方法提取来自不同国家的两个电子商店网站不同产品的属性,实验结果表明,提出的方法较好地兼顾了信息提取的完整性和准确性,商品信息的平均提取准确率可高达98. 39%。  相似文献   

7.
Web已经发展为世界上最大的公共数据来源,从海量异构、半结构化的Web页面中提取特定信息逐渐成为数据挖掘的重要任务。目前信息提取任务研究的重心正在逐渐转向深度学习领域,本文提出基于双向GRU(Gated Recurrent Unit)的深度神经网络模型进行Web信息提取,解决序列长距离依赖问题,采用词嵌入结合字符嵌入算法加强语义表达,减少冗余文本干扰,双向模型充分利用文本上下文,快速、准确地对输入序列实现特定信息提取。  相似文献   

8.
信息提取技术是自然语言处理技术的关键技术之一,其中最主要的任务是事件元素提取.本文利用深度学习网络模型实现信息提取任务进行了深入研究.训练数据来源于上海大学构建的CEC已标注的语料库.相比于采用手工设立规则的识别方式和BiLSTM网络模型,本文通过对数据进行预处理和搭建BERT-BiLSTM-CRF深度网络模型,对文本数据训练实现标注,在时间、报道时间、参与对象的识别准确率上均有所提升.  相似文献   

9.
互联网拓扑反映了网络元素之间的连接情况和连通特性,是网络空间地图的重要组成部分,受到了网络空间测绘领域相关研究的重点关注。然而,当前的网络拓扑测绘工作主要从网络层面构建拓扑刻画模型,再利用IP定位信息将其映射到地理信息系统(Geographical Information System,GIS)底图上,对地理区域之间的路由关系和连通特征关注甚少。为此,基于IP接口级拓扑构建了面向地理空间的网络拓扑模型,提出度量参数对国家/地区间的路由关系和连通特征进行分析,发现在全球互联网中发挥关键作用的地理区域,为全面掌握各国家/地区在网络空间的整体连通特性提供支撑。  相似文献   

10.
徐晓彩 《信息技术》2012,(5):164-167
介绍了一种基于分布式语音识别(DSR)的语音信息提取系统的设计。在客户端提取语音特征向量,编码后经过信道传输至服务器端,在服务器端用HTK工具进行语音的识别,使用Stanford parser进行句法分析以提取关键信息。通过仿真实验,该系统实现了语音信息的提取。  相似文献   

11.
随着互联网技术的高速发展,人们对上网的需求不只局限在内容上,更多地开始重视对网络信息内容、网络通信双方身份及通信模式的隐匿保护.暗网正是采用隐匿上网者的IP报文信息的手段,来保护个人私有信息并实现防追踪功能.由于暗网的特性,当前针对暗网的监管较少,同时暗网的"匿名技术"使得寻常手段很难追踪到暗网的使用者.以上因素造成了...  相似文献   

12.
随着我国信息化进程的推进,人们开始认识到互联网作为信息来源的重要性,如何更有效地从网络的海量信息中抽取所需要的内容并进行合理的组织和利用已经成为亟待解决的问题。本文通过对DSE算法和RoadRunner系统中的算法的探讨和改进,提出了一种新的自动生成模板的信息抽取方法,并且在确定同模板网页url的阈值时引入了生物信息学中的FDR方法,为阈值的确定提出了理论根据。实验结果表明,经过改进的抽取方法对抽取结果的准确率有着明显的改善作用。  相似文献   

13.
分析Web挖掘的关键技术,对数字挖掘中需要解决的技术问题进行了深入的探讨,通过对电子商务领域应用Web挖掘技术,准确获取信息的研究,指出数字挖掘技术将在未来获取有益的信息和知识这一领域中发挥重要的作用。  相似文献   

14.
Measuring the size of the Internet via Monte Carlo sampling requires probing a large portion of the Internet protocol (IP) address space to obtain an accurate estimate. However, the distribution of information servers on the Internet is highly nonuniform over the IP address space. This allows us to design probing strategies based on importance sampling for measuring the prevalence of an information service on the Internet that are significantly more effective than strategies relying on Monte Carlo sampling. We present thorough analysis of our strategies together with accurate estimates for the current size of the Internet Protocol Version 4 (IPv4) Internet as measured by the number of publicly accessible web servers and FTP servers.  相似文献   

15.
基于M序列与Word文档的信息隐藏算法   总被引:1,自引:1,他引:0  
刘志军 《通信技术》2009,42(7):113-115
文中提出了一种新的基于M序列加密库在Word文档中信息隐藏的算法。通过M序列生成的理论分析和计算,可优化出M序列加密库。设计了信息的嵌入与提取算法。利用VB实现了信息的嵌入与提取,并在互联网上进行了信息传输试验。试验结果表明信息传输安全可靠。文中的方案在互联网保密通信中具有较好的应用前景和使用价值。  相似文献   

16.
随着社会的发展,互联网行业在发展过程中逐渐兴起,为了保证互联网站的使用效果,就要让网站具有一定的交互功能,从而使其能够更好的与访问者进行交互,在这一需求下,互联网网站由传统的静态网站逐渐演变成交互式动态网站,与传统静态式网页设计相比,交互式动态网站难度更大,因此本文详细分析交互式动态网站的设计与制作,希望能够为网页设计制作人员提供一些有价值的信息,促进互联网行业的发展.  相似文献   

17.
针对现有职位信息抽取方法由于缺乏自适应性和并行性,存在冗余度高和抽取效率低的问题,提出了基于CSS模板的方式并行职位信息抽取方法。该方法根据职位信息页面特点使用CSS路径抽取方法,并制定抽取模板解决抽取的准确性和自适应性,使用了MapReduce编程模型实现职位信息的并行化抽取。使用MD5算法计算已抽取得到的职位信息的MD5值,结合MapReduce并行计算编程模型的特性实现职位信息去重,最终将去重后的职位信息存储在分布式数据库HBase。实验测试结果表明,并行计算与传统的非并行编程模型相比在处理的时间效率和采集的职位信息量上都有明显的提高。  相似文献   

18.
李慧  施荣华 《信息技术》2007,31(12):73-76
网页过滤系统旨在帮助用户屏蔽不健康的网页。提出了基于混合模式的网页过滤模型,将传统的基于网址过滤和敏感词过滤的方法与基于文本分类的过滤方法结合起来。重点讨论了特征量选取、网页结构化信息利用等方面的改进措施。实验表明这种模型在保持易于实现的特点的同时,在速度和准确度方面都有不同程度的提高。  相似文献   

19.
利用Web挖掘技术实现公安机关对互联网的管控   总被引:1,自引:1,他引:0  
随着互联网的发展,社会各热点、敏感等信息及有害网站、有害数据均会以最快的速度在互联网上出现。论文从公安工作的实际需求出发,通过分析Web挖掘的内容挖掘和记录挖掘实现技术,对公安机关如何利用Web挖掘方法加强对互联网信息的监管和控制进行了细致的分析。  相似文献   

20.
Web信息抽取技术一直是信息技术领域的研究热点。而且,近年来,DIV+CSS的网页布局方法开始普遍应用于网页设计中。基于此,提出了一种较为简单和实用的基于正文特征和网页结构的新闻网页正文抽取方法。首先识别和提取网页正文内容块,然后利用正则表达式滤除内容块中的HTML标记并提取网页正文。实验结果表明,该方法对正文抽取具有较高的通用性与准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号