排序方式: 共有28条查询结果,搜索用时 0 毫秒
1.
GIS空间数据与属性数据的文件组织结构研究 总被引:1,自引:0,他引:1
针对传统GIS数据管理方法都是将空间数据与属性数据分隔开来分别进行管理的缺点,提出一种用于将空间数据和属性数据进行统一管理的文件组织方法。文中分别给出空间数据和属性数据的数据结构,然后采用层次性结构化文件系统结合文件索引和数据字典技术来对空间数据和属性数据进行统一管理。该方法能够对各实体信息表示尽量结构化,从而加快大数据量应用的存取速度。 相似文献
2.
3.
个性化自适应资源推荐是以学习者为中心、以人工智能和大数据技术为基础,模拟人类思维进行学习资源推荐的过程。论文在分析学习者和资源学习风格的基础上,分别构建学习者模型和资源模型,运用基于学习风格过滤推荐算法、协同过滤推荐算法、关联规则推荐算法,展开个性化自适应资源推荐研究。研究结果表明,以学习风格为基础的混合式自适应推荐的结果,更贴合学习者的个性化学习需求。 相似文献
4.
词语语义相似度计算在很多自然语言处理相关领域都有着广泛应用.基于知网的现有词语语义相似度计算方法未深入考虑同棵义原层次树的义原距离、义原深度、义原密度及主次关系的影响,致使相似度计算结果并不够精确.针对该问题,提出一种词语语义相似度改进算法,通过分析知网中的义项表达式和义原层次树,用集合的加权平均值代替了义项相似度最大... 相似文献
5.
目前如何对互联网上的海量数据进行文本分类已经成为一个重要的研究方向,随着云计算技术和Hadoop平台的逐步发展,文本分类的并行化方式将能够更有效的解决当前的问题.论文针对文本分类中特征选择阶段对文本分类性能有很大影响的缺点,提出了一种改进的特征选择算法——类别相关度算法(Class Correlation Algorithm,CCA),同时根据Hadoop平台在海量数据存储和处理方面所具有的优点,利用MapReduce的并行编程框架和HDFS分布式存储系统对文本分类的各个阶段实现了并行化编程.最后通过实验将Hadoop平台下的文本分类的优化算法与传统的单机运行环境下的文本分类算法进行了对比分析,实验结果表明对于相同的数据集,该算法在运算时间上有极大的提高. 相似文献
6.
针对文本自动分类问题,提出了一种基于模糊向量空间模型和径向基函数网络的分类方法.网络由输入层、隐层和输出层组成.输入层完成分类样本的输入,隐层提取输入样本所隐含的模式特征,将分类结果在输出层表现出来.该方法在特征提取时充分考虑了特征项在文档中的位置信息,构造出模糊特征向量,使自动分类更接近手工分类方法.以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性. 相似文献
8.
在文本分类过程中,经典的最近邻分类算法(KNN)面对海量数据时的执行时间较长.对经典KNN算法进行改进,通过在训练阶段构造初级分类器以减少训练阶段的计算量,并在Hadoop平台MapReduce下予以实现.实验结果表明,改进后的算法可以在保证分类精度的情况下节省运行时间. 相似文献
9.
10.
中文真词错误自动校对是自然语言理解的一项重要的基础研究课题,油田数字化过程中利用图像识别及人工录入产生的中文真词错误会直接影响后期数据综合分析准确度。对中文真词错误成因和统计语言模型进行分析,提出一种面向油田领域的中文真词错误自动校对方法。该方法首先构建通用领域和油田领域混淆集,再引入同义词集丰富知识库,对语料分词后,综合统计分析目标词与混淆词、周边词的同义词之间关系,自动校对真词错误。实验表明,提出的方法能有效校对油田领域的中文真词错误。 相似文献