首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 343 毫秒
1.
根据Web数据流的特点,采用Web数据挖掘技术设计了一个资源服务系统:利用关联、聚类、分类等算法对离线数据进行挖掘,利用概要数据库、滑动窗口、近似因子等技术对动态数据进行处理.该系统由用户层、挖掘层及数据层组成,可实现用户交互、数据流挖掘及数据处理、提供数据资源等功能.该系统还可进行各种类型网站的Web数据挖掘,作为推广开发服务平台,实现网站资源服务系统的功能,应用于校园网挖掘的效果较好.  相似文献   

2.
随着时光的流逝,科技已经得到了快速的发展。机器学习和数据挖掘技术在不知不觉中已经发展到了相对成熟的地步,在日常生活中被广泛应用。随着互联网技术的不断完善,人们对网络的依赖程度越来越高,文本信息以各种各样的形式在网络中传递,文本的分类研究也已经涉及日常生活中的各个领域,包括平时所见的用户评论挖掘、网页分类、微博情感分析、Web文档自动分类、数字图书馆、自动文摘、单词语义辨析等有关操作。  相似文献   

3.
随着Internet使用的广泛性和Web技术的发展,数据挖掘这一技术研究也逐渐的走进了基于Web研究的阶段。数据挖掘技术已经在不同的领域广泛的应用,本文主要分析探讨了关于Web数据的特点有哪些,以及Web数据挖掘的分类,当然最重要的一点就是Web数据挖掘技术的应用,主要表现在对网络服务性能上的提高,以及给电子商务企业等带来的影响和其他领域的应用。  相似文献   

4.
新闻网站上的海量新闻具有行业商机、信息洞察等重要研究价值,利用自然语言处理技术进行自动化的信息萃取,替代纯人工筛选信息,方便完成生产报告并推送给领导或关键人。该文以中国移动智慧咨询新闻萃取业务场景为依托,提出DDCAMS,系统介绍从海量新闻当中筛选和处理信息的技术架构及构建流程,包括文本去重、文本去噪、文本分类和文本摘要4个模型,目前已完成初代版本的研发,性能达到预期。打造中国移动AI引领业务变革的应用实践案例,有效提高数智化管理水平,助力公司建设成为“一流的数智化服务提供商”。  相似文献   

5.
为弥补传统胶囊网络在进行文本分类时无法识别文本序列中各单词的重要程度及其之间的依赖关系,该文提出一种融合BiGRU和多头注意力机制的胶囊文本分类模型——BMCapsNet模型。该模型首先使用BiGRU和多头注意力机制对文本进行全局特征获取,然后利用胶囊网络提取更深层次的语义信息并通过胶囊预测进行文本分类。将其应用于中文新闻标题文本分类任务,在THUCNews新闻标题数据集和今日头条新闻标题数据集上证明模型的有效性。  相似文献   

6.
针对庞大的预案文本资源分类难的问题,将可调整的邻域阈值Eps取代原有的全局Eps,得到了改进的DBSCAN密度聚类算法.以预案文本间的相似度作为聚类基本的度量属性,将改进的DB-SCAN算法应用于应急预案分类管理,以去除边界.仿真结果证明该方法不仅不影响预案本来的基础分类方式,而且更易于实现,在一定程度上能够缓解噪音点误识别问题,对提高预案文本的重用性和分类的准确率有一定的参考意义.  相似文献   

7.
随着Internet的广泛应用,Web数据挖掘技术成为相关领域的研究热点之一,但Web数据控制的复杂性限制了该技术的发展。XML的应用为解决Web数据挖掘技术难题带来了契机。本文针对Web数据挖掘的特点,分析了XML在Web数据挖掘技术中的应用优势,并就以XML为基础的Web数据挖掘技术系统框架进行了分析。  相似文献   

8.
针对短文本分类关键词特征稀疏和样本数量多,难以处理的技术难点,提出一种基于语义的KNN短文本分类算法.该算法采用基于字的分词策略提取出短文本的特征词,结合中国知网对关键词进行概念映射以提高短文本的语义表达,并针对短文本特点,通过使用LSA降维处理,对KNN分类算法加以改进.实验结果表明,该算法能够有效提高短文本的分类性能.  相似文献   

9.
基于语义的Web挖掘是使用从现有的Web数据中抽取的语义或直接使用Web数据中已有的语义结构来帮助Web挖掘。本文首先简单介绍Web挖掘与语义Web的相关知识,接着论述了基于语义的Web挖掘,最后给出了一个实例说明这个方法的有效性。  相似文献   

10.
朴素贝叶斯算法是一种基于概率统计的分类算法,广泛应用于机器学习中分类问题的求解中。文本分类是自然语言处理和数据挖掘领域中的研究热点有着广泛的应用前景。朴素贝叶斯算法已经在文本分类中取得了较好的分类效果,但是由于文本词向量的特征向量维度高,很多分类算法的求解效率和准确率都不高。文章提出一种基于词向量间余弦相似度的改进朴素贝叶斯算法,有效的降低了特征向量的数据冗余和计算复杂性。  相似文献   

11.
中文自动校对的原理与实现   总被引:1,自引:0,他引:1  
本文简要介绍了中文自动校对的主要原理和基本算法,讨论了校对软件系统现有工作方式及校对流程。  相似文献   

12.
文章讨论了印刷文本的印刷适性,认为它是为方便阅读所具备的工程技术属性,印刷文本是一个多层次的系统。  相似文献   

13.
为规范食品检验的表征和应用,促进食品检验信息的处理和交换,加快食品检验数据的融合和共享,提升食品检验综合效能,本文对食品检验核心技术要素信息进行结构重塑性整合,采用线分类法与面分类法相结合的混合分类法,创建食品检验项目分类体系和食品检验方法分类体系,采用顺序码、并置码和组合码的编码方法,研制食品检验项目编码方案和食品检验方法编码方案,设计6码段16码位的编码结构,构建具有稳定的逻辑结构特征和开放的数据扩展功能的食品检验分类编码通用系统。通用系统具有高度专业集成性和广泛行业通用性,能够为特定的食品检验事件赋予唯一的十进制阿拉伯数字代码,实现食品检验高效查询。还对运用计算机编程技术研发基于互联网云端的的食品检验分类编码通用信息系统公共技术服务产品提出设想和展望。  相似文献   

14.
互文性理论研究浅述   总被引:1,自引:0,他引:1  
20世纪60年代后期,法国符号学家克里斯蒂娃(Kristeva)首先提出了"互文性"(intertextuality)这一概念,进而演变成一种理论。自互文性理论提出以来,虽然一直受到学术界的关注,但仍处于饱含争议的阶段。本文对互文性理论的起源、定义、分类以及在语篇语言学方面的应用进行了简要的综述,以为今后的应用研究提供一定的理论基础。  相似文献   

15.
文本数字水印技术研究   总被引:3,自引:0,他引:3  
为了有效地保护各种数字化产品的版权,防止产品被篡改、假冒和盗用,提出一种新的数字产品版权保护技术即数字水印技术,分析了数字水印技术的特点及处理模型.鉴于文本文件的规则结构,通常用于图像、音频、视频等方面的数字水印方法不适合文本,故对文本数字水印技术的各种算法进行了分析,并引入了基于自然语言处理的文本水印技术.  相似文献   

16.
基于超文本标记语言5的横编计算机辅助设计系统   总被引:1,自引:0,他引:1  
为满足横编针织物在线设计的需求,在传统横编计算机辅助设计(CAD)的基础上,基于超文本标记语言5(HTML5)技术设计并实现互联网横编CAD系统。根据横编针织物的设计特点和成形原理,分别对花型数据和成形数据进行数学建模和数据结构优化,实现多视图设计和成形工艺设计。同时,结合数据库技术开发款式与组织库自定义的功能,并在研究花型编译的基础上,实现上机文件的生成。此外,研究了软件架构,基于B/S模式将程序部署在服务器上,系统的运行则在客户端,从而实现了数据处理与显示的分离。最后,通过提花围巾设计实例进行系统检验,结果表明该系统设计织物直观方便效率高,满足横编针织物在线设计的需求。  相似文献   

17.
This paper introduces a new definition and classification system for home meal replacements (HMR), based on convenience attributes as viewed by consumers. An overview of other food classifications, focusing on methodological aspects, is also presented. The classifying criteria chosen (shelf-life and required preparation) and their organisation in a 4×4 matrix structure demonstrated to provide a sound and effective way of classifying HMR. A qualitative analysis of HMR consumption in The Netherlands was performed by application of the developed system. Results showed that the use of a narrow range of HMR is characteristic of Dutch food consumption. The classification system is expected to provide valuable support for consumer-oriented product and process development.  相似文献   

18.
针对传统计米器使用中易受工作环境影响,造成计米器损坏或按键失灵的问题,提出将计米脉冲信号输入到S7-200PLC的高速数字量输入端,利用S7-200PLC的内部计数功能实现计米,并在TD200文本显示器上进行显示的控制方案。计米系统由西门子S7-200PLC、TD200文本显示器和NPN型接近开关组成,S7-200PLC主要完成计米信号采集和运算,同时根据TD200文本显示器的预置值控制设备启停;TD200文本显示器实现计米的预置值设定和计米数值的实时显示。给出计米系统的接线图及计米控制程序、文本显示程序。将该系统用于水箱拉丝机钢丝计米,取得了良好的使用效果,既提高了抗干扰能力,又节约了维修成本。  相似文献   

19.
基于Web的色谱分析教学课件的制作   总被引:1,自引:0,他引:1  
利用网页制作工具Frontpage 98 和超文本标记语言等将色谱分析教学中有关文字、声音、图像等资料组织起来,制作了基于Web 的色谱分析超媒体教学课件.该课件可以运行于单机或网络(只要具有可浏览超文本的浏览器即可),可在几乎所有操作系统和不同类型计算机上运行而勿需修改  相似文献   

20.
Big data analysis has found applications in many industries due to its ability to turn huge amounts of data into insights for informed business and operational decisions. Advanced data mining techniques have been applied in many sectors of supply chains in the food industry. However, the previous work has mainly focused on the analysis of instrument‐generated data such as those from hyperspectral imaging, spectroscopy, and biometric receptors. The importance of digital text data in the food and nutrition has only recently gained attention due to advancements in big data analytics. The purpose of this review is to provide an overview of the data sources, computational methods, and applications of text data in the food industry. Text mining techniques such as word‐level analysis (e.g., frequency analysis), word association analysis (e.g., network analysis), and advanced techniques (e.g., text classification, text clustering, topic modeling, information retrieval, and sentiment analysis) will be discussed. Applications of text data analysis will be illustrated with respect to food safety and food fraud surveillance, dietary pattern characterization, consumer‐opinion mining, new‐product development, food knowledge discovery, food supply‐chain management, and online food services. The goal is to provide insights for intelligent decision‐making to improve food production, food safety, and human nutrition.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号