首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
文章阐述了利用XML中的DOM树将Web数据结构分析,转化为结构化的XML数据,使用Xpath实现数据匹配查找数据,通过正则表达式实现数据抽取。同时,对目前数据抽取技术做一些简单探讨研究。  相似文献   

2.
设计了一种基于预定义模式W eb网页结构化数据抽取包装器软件.该软件利用最新W eb技术、信息处理技术、人工智能技术对W eb网页结构化信息解析,从非结构化的、不包括任何语义的HTML文档中抽取结构化语义数据.选取了几个出版社的新书发布W eb页面进行了数据抽取验证和抽取结果分析.结果表明该软件可实现W eb网页新书发布信息集成,并提供新书检索服务.  相似文献   

3.
林雯  林芳 《广西轻工业》2007,23(9):69-71
本文分析了Apriori算法存在的不足,与可以改进的方向。然后针对网络化制造业面临客户业务量大,数据繁多复杂等特点,并结合制造业的实际情况,提出了一种Apriori改进算法(PAP算法),以提高Apriori算法的效率,并对该算法进行验证。  相似文献   

4.
5.
6.
针对密集型Web信息的数据抽取问题,提出了一种适合于XML结构又较为通用的树型结构抽取规则,把密集型Web上的数据抽取出来整合到指定模式的XML文档中.使用基于样例学习的半结构化Web信息抽取方法,自行开发了一个基于XML的Web新书查询原型系统,抽取Web页面效果良好,可直接应用于专门的Web网站信息的抽取,也可以用于其他相关应用的数据准备阶段.  相似文献   

7.
文章提出了一种基于改进RANSAC算法的图像拼接方法。在提取图像的SIFT特征点后,根据阈值法对特征点进行初始匹配,然后采用改进的RANSAC算法对初始匹配对筛选,再计算图像间单应性矩阵,最后使用加权平均的融合方法实现图像的无缝拼接。实验结果表明,改进后的RANSAC算法进一步提纯了匹配对,使得图像拼接获得了高质量的效果。  相似文献   

8.
借助于奇、偶行(列)矩阵,前、后行(列)矩阵,奇偶行(列)分块矩阵及分块矩阵的准数乘运算等概念,分析了按时间抽取(DIT)的基-2 FFT算法分量形式的特点.将以自然数次序输出的按时间抽取(DIT)的基-2 FFT算法用较简单的矩阵形式来表示.  相似文献   

9.
文章提出了一种基于改进RANSAC算法的图像拼接方法。在提取图像的SIFT特征点后,根据阈值法对特征点进行初始匹配,然后采用改进的RANSAC算法对初始匹配对筛选,再计算图像间单应性矩阵,最后使用加权平均的融合方法实现图像的无缝拼接。实验结果表明,改进后的RANSAC算法进一步提纯了匹配对,使得图像拼接获得了高质量的效果。  相似文献   

10.
11.
提出一种基于非完全信息算法的牛肉大理石花纹提取方法。首先,在遍历理论和对象有效性相关原理的基础上构建了非完全信息算法。然后,结合加权平均值灰度化算法、自适应最佳阈值算法和改进的自适应模糊多级中值滤波算法实现上述方法。研究表明,该方法能够准确有效地反映出牛肉大理石花纹的真实情况。  相似文献   

12.
周露露 《中国造纸》2011,30(12):47-50
采用传统Hough变换法检测复杂纸页缺陷如褶皱、条痕等直线类特征纸病时,不能有效分辨具有较近斜率或截距的多直线特征.在标准Hough变换的基础上将Hough变换域空间变换为二维图像然后对其进行纸页缺陷特征提取,从而更加精确地检测出褶皱或条痕类纸病.经实验证明,改进的Hough变换在检测精度和时间上都优于标准Hough变换.  相似文献   

13.
一种改进的k-means算法   总被引:5,自引:0,他引:5  
k-means(k均值)算法是聚类方法中常用的一种划分方法.该算法适合对海量数据进行聚类,对球状、凸形分布的数据具有很好的聚类效果,但该算法有其突出的局限性,少量的孤立点就会对聚类结果产生很大的影响,因此,采用聚类均值点与聚类种子相分离的思想,给出了基于该思想的对k均值算法的改进算法.实验表明,该改进算法比原k均值算法具有更高的准确性.  相似文献   

14.
为了提高裱糊线机器人视觉系统定位精度,降低图像边缘冗余信息与噪声影响,提出将基于混合蛙跳优化算法的Canny算子应用于裱糊线机器人裱纸的边缘检测中。通过采用最大类间方差作为混合蛙跳算法的目标函数,自适应迭代优化Canny算子双阈值,实现裱糊线有效提取。仿真试验结果表明,该算法优化Canny算子可较好检测裱纸图像的边界轮廓,自适应获取最优阈值,弥补传统Canny算子需要人为设定的缺点,提高了检测精准性,同时具备一定降噪效果。该算法较粒子群优化算法、传统Canny算法C/A分别降低3.33%、33.39%,C/B分别降低了14.94%、54.55%。  相似文献   

15.
对小麦胚芽油的提取方法进行了综述,介绍了压榨法、浸出法、超临界二氧化碳萃取法、冷榨法、水酶法等制取小麦胚芽油的原理、工艺,并分析比较了各种方法的优缺点,对小麦胚芽油的工业化生产具有指导意义。  相似文献   

16.
南瓜多糖提取方法研究   总被引:6,自引:0,他引:6  
通过正交试验确定南瓜多糖热水浸提法最佳提取工艺,然后以提取液中多糖含量为指标,对热水浸提法、超声波法和复合酶法提取南瓜多糖进行了比较研究。结果表明,三种方法中复合酶法不仅提取率最高,工艺最简易,而且制得的粗多糖中蛋白质含量低,不需要进行脱蛋白工艺,是较佳的南瓜多糖提取方法。  相似文献   

17.
CO2啤酒花浸膏因质量稳定,易于储存和利用率高等特点在啤酒酿造中的使用量正在逐年增加。文章考察了超临界CO2萃取啤酒花浸膏的工艺对产品中啤酒花多酚含量的影响,并以超临界CO2萃取啤酒花的萃余物质为原料,研究了从中提取啤酒花多酚的可能性。结果表明,当萃取温度为40℃,萃取压力大于25MPa时,浸膏中的多酚含量明显提高,更高的提取温度得到的产品中多酚的含量没有明显的提高。采用溶剂法从萃余物质中提取啤酒花多酚的实验表明,50%(W/W)的丙酮-水的混合溶剂体系对啤酒花多酚的提取效果最好,总收率可达到83.70%(W/W),从超临界萃取啤酒花的萃余物质中提取啤酒花多酚可提高啤酒花综合利用的价值。  相似文献   

18.
一种基于连通域标记的纸病检测算法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了一种基于段的连通域标记处理算法,同时对纸病区域进行连通域标记和形状特征值提取,旨在提高纸病检测的准确率和效率。该算法利用纸病区域为简单连通图像的特点,采用段技术实现了纸病区域的标记处理,探讨了在标记处理同时快速统计与形状特征值计算有关的中间参数的方法,利用标记结果及形状特征值实现了纸病的快速检测。该算法优化了标记处理与形状特征值提取的过程,减少了纸病图像的扫描次数。结果表明,该算法达到了准确、快速的纸病检测效果,且易于扩展到实际的纸病检测系统中。  相似文献   

19.
汤伟  张龙  王锦韫  方嘉楠 《中国造纸》2023,42(7):153-160
本课题提出了一种适合高速宽幅造纸机纸病在线实时检测的复合算法,该算法的基本思想是:首先通过快速傅里叶变换(fast Fourier transform,FFT)将时域图像转换到频域,以便使用频域图像与高斯(Gaussian)高通滤波器做乘积运算进行滤波;再通过快速傅里叶逆变换(inverse fast Fourier transform,IFFT)将频域中的图像转换到时域,以便下一步使用运算速度较快的分水岭算法对滤波后的图像进行快速缺陷分割,实现纸病在线实时检测。利用采集到的2000余张纸病图片进行纸病检测实验,结果表明,本课题提出的复合算法具有快速、高效、适用性强、分割效果好等优点,可满足纸病在线检测对图像处理算法实时性和准确性两方面的要求。  相似文献   

20.
浸提法提取番茄红素工艺的研究   总被引:9,自引:2,他引:9  
研究了在不同的提取液、提取温度、时间、物料比等因素下从番茄中提取番茄红素的效果 ,确定了最佳的浸取工艺条件 ,为进一步开发这种功能性天然色素提供理论依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号