排序方式: 共有79条查询结果,搜索用时 15 毫秒
1.
信号与信息处理的需求日益增加,离不开数据处理技术,数据处理需要数据库的支持,然而没有经过训练的使用者会因为不熟悉数据库操作产生诸多问题。文本转结构化查询语言(Text to Structured Query Language, Text-to-SQL)的出现,使用户无需掌握结构化查询语言(Structured Query Language, SQL)也能够熟练操作数据库。介绍Text-to-SQL的研究背景及面临的挑战;介绍Text-to-SQL关键技术、基准数据集、模型演变及最新研究进展,关键技术包括Transformer等主流技术,用于模型训练的基准数据集包括WikiSQL和Spider;介绍Text-to-SQL不同阶段模型的特点,详细阐述Text-to-SQL最新研究成果的工作原理,包括模型构建、解析器设计及数据集生成;总结Text-to-SQL未来的发展方向及研究重点。 相似文献
2.
3.
4.
深度学习模型在多元时间序列预测、智能驾驶、图像识别等多个领域广泛应用,其中多元时间序列预测是学者们关注的重点之一,多元时间序列预测是典型的回归任务,旨在通过海量的历史数据构建模型以预测未来状态,被广泛运用于交通、电力、金融等领域.多元时间序列数据具有复杂的时空依赖性,现有模型大多仅能捕获序列数据中的时间特征,难以捕获空间特征,而图神经网络解决了这一问题.图神经网络能够自然地建模实体间的复杂关系,可以很好地处理拓扑数据,而多元时序数据大多可以构造为拓扑图,因此图神经网络可以很好地学习多元时序数据中的空间特征.基于图神经网络的多元时间序列预测模型受到广泛关注并取得了一定的成果,但现有基于图神经网络的模型仍存在诸多不足.首先,现有方法大多分别捕获和建模多元时间序列数据中的空间特性和时间特性,未充分考虑多元时间序列的时空统一性,导致模型的次优建模;其次,现有方法主要基于静态预定义图或动态自适应图,其中静态预定义图通常根据监测节点之间的空间相关性进行构造且不会随着时间而改变,基于预定义图的研究忽略了时间序列数据中的时间特征,即忽略了数据模式随时间发生的改变;而自适应图通常由模型自主学习并不包含监测节点间的固有属性,基于自适应图的研究忽略了大量有效的领域知识,如道路的连通性和道路间的属性.为了解决上述问题,提出基于动态自适应时空图的多元时序预测模型MTP-Graph(Multivariate Time series Predic-tion model based on dynamic adaptive spatio-temporal Graph),利用时空融合模块将时空信息进行统一处理,避免了分开捕获时间特性与空间特性而导致的次优建模问题,提出图结合模块将静态预定义图和动态自适应图进行动态融合,获取时空信息的同时充分考虑领域知识,使模型可以更好地学习多元时间序列中的时空特性.在PeMSD3、PeMSD7和PeMSD8数据集上的大量实验结果表明,MTP-Graph预测性能优于其他基准方法,验证了MTP-Graph的可用性和有效性. 相似文献
5.
索引是一种用于提高数据库查询效率的数据结构,良好执行计划的生成和选择很大程度上取决于数据表上是否存在合适的索引。然而,面对复杂的时空数据场景,现有的索引选择方法存在很多不足,如无法高效处理大量范围查询、容易造成索引冗余、无法有效应对动态的工作负载等问题。针对上述问题,提出一种新型基于深度确定策略梯度(Deep Deterministic Policy Gradient,DDPG)模型和索引效益评估网络的索引选择框架:ST-IS(Index Selection method tailored for Spatio-Temporal data scenarios)。ST-IS集成了对SQL语句和索引集的新型编码方法,有效避免索引冗余或索引缺失。ST-IS使用索引效益评估网络来优化强化学习的奖励机制,同时支持动态的工作负载。大量实验结果表明,在真实时空数据集和TPC-DS标准数据集上,ST-IS的性能优于现有的索引选择方法。 相似文献
6.
基数估计和代价估计可以引导执行计划的选择,估计准确性对查询优化器至关重要.然而,传统数据库的代价和基数估计技术无法提供准确的估计,因为现有技术没有考虑多个表之间的相关性.将人工智能技术应用于数据库(artificial intelligence for databases, AI4DB)近期得到广泛关注,研究结果表明,基于学习的估计方法优于传统方法.然而,现有基于学习的方法仍然存在不足:首先,大部分的方法只能估计基数,但忽略了代价估计;其次,这些方法只能处理一些简单的查询语句,对于多表查询、嵌套查询等复杂查询则无能为力;同时,对字符串类型的值也很难处理.为了解决上述问题,提出了一种基于树型门控循环单元, Tree-GRU (tree-gated recurrent unit)的基数和代价估计方法,可以同时对基数和代价进行估计.此外,采用了有效的特征提取和编码技术,在特征提取中兼顾查询和执行计划,将特征嵌入到Tree-GRU中.对于字符串类型的值,使用神经网络自动提取子串与整串的关系,并进行字符串嵌入,从而使具有稀疏性的字符串变得容易被估计器处理.在JOB、Synthetic等数据集上进... 相似文献
7.
基因表达式编程种群多样性自适应调控算法 总被引:1,自引:0,他引:1
为了解决基因表达式编程GEP种群多样性控制问题,提出了一种新的带权种群多样性的自适应调控方法。设计了带权的种群多样性测度方法,详细分析了选择、交叉及变异算子对种群多样性的影响。提出了初始种群的多样化算法DAIP,以保证初始种群多样性的最大化。设计了自适应的交叉和变异算子,提出了种群多样性自适应调控算法APDTA,使种群在进化过程中维持合适的种群多样性,进而提高进化效率。实验验证了APDTA的有效性。 相似文献
8.
基于加权频繁项集的文本分类规则挖掘 总被引:2,自引:0,他引:2
针对特征向量分量的权重和文本大小对分类规则产生的影响,提出一种可以提高关联文本分类性能的文本分类规则挖掘方法,提出了加权频繁项集的概念和相应的加权频繁项集挖掘算法,在分类规则中突出特征向量权重大的向量分量;提出一种特征向量预处理方法,消除文本大小对挖掘分类规则的影响.实验表明,解决上述两个问题将可以很好的提高文本分类的性能. 相似文献
9.
异质图神经网络作为一种异质图表示学习的方法,可以有效地抽取异质图中的复杂结构与语义信息,在节点分类和连接预测任务上取得了优异的表现,为知识图谱的表示与分析提供了有力的支撑.现有的异质图由于存在一定的噪声交互或缺失部分交互,导致异质图神经网络在节点聚合、更新时融入错误的邻域特征信息,从而影响模型的整体性能.为解决该问题,提出了多视图对比增强的异质图结构学习模型.该模型首先利用元路径保持异质图中的语义信息,并通过计算每条元路径下节点之间特征相似度生成相似度图,将其与元路径图融合,实现对图结构的优化.通过将相似度图与元路径图作为不同视图进行多视图对比,实现无监督信息的情况下优化图结构,摆脱对监督信号的依赖.最后,为解决神经网络模型在训练初期学习能力不足、生成的图结构中往往存在错误交互的问题,设计了一个渐进式的图结构融合方法.通过将元路径图和相似度图递增地加权相加,改变图结构融合过程中相似度图所占的比例,在抑制了因模型学习能力弱引入过多的错误交互的同时,达到了用相似度图中的交互抑制原有干扰交互或补全缺失交互的目的,实现了对异质图结构的优化.选择节点分类与节点聚类作为图结构学习的验证任务,在4种... 相似文献
10.
如何利用多源异构时空数据进行准确的轨迹预测并且反映移动对象的移动特性是轨迹预测领域的核心问题.现有的大多数轨迹预测方法是长序列轨迹模式预测模型,根据历史轨迹的特点进行预测,或将当前移动对象的轨迹位置放入时空语义场景根据历史移动对象轨迹预测位置.综述当前常用的轨迹预测模型和算法,涉及不同的研究领域.首先,阐述了多模式轨迹预测的主流工作,轨迹预测的基本模型类;其次,对不同类的预测模型进行总结,包括数学统计类、机器学习类、滤波算法,以及上述领域具有代表性的算法;再次,对情景感知技术进行了介绍,描述了不同领域的学者对情景感知的定义,阐述了情景感知技术所包含的关键技术点,诸如情景感知计算、情景获取和情景推理的不同类模型,分析了情景感知的不同分类、过滤、存储和融合以及它们的实现方法等.详细介绍了情景感知驱动的轨迹预测模型技术路线及各阶段任务的工作原理.给出了情景感知技术在真实场景中的应用,包括位置推荐,兴趣点推荐等,通过与传统算法对比,分析情景感知技术在此类应用中的优劣.详细介绍了情景感知结合LSTM (long short-term memory)技术应用于行人轨迹预测领域的新方法.最后,总结了... 相似文献