带复杂计算的金融领域自然语言查询的SQL生成 |
| |
引用本文: | 何佳壕,刘喜平,舒晴,万常选,刘德喜,廖国琼.带复杂计算的金融领域自然语言查询的SQL生成[J].浙江大学学报(自然科学版 ),2023(2):277-286. |
| |
作者姓名: | 何佳壕 刘喜平 舒晴 万常选 刘德喜 廖国琼 |
| |
作者单位: | 江西财经大学信息管理学院 |
| |
基金项目: | 国家自然科学基金资助项目(62076112,61972184);;江西省自然科学基金资助项目(20192BAB207017);;江西省教育厅科学技术研究资助项目(GJJ190255); |
| |
摘 要: | 研究金融领域基于自然语言查询的结构化查询语言(SQL)生成问题(Text-to-SQL),构建一个金融领域Textto-SQL数据集,称为SOFT数据集.该数据集覆盖了金融领域的常见查询,具有鲜明的特点,并对Text-to-SQL提出了挑战.提出金融领域Text-to-SQL模型FinSQL,该模型优化了对金融领域复杂查询的支持.通过分析一类复杂计算查询(行计算查询)的特点,提出一种基于分治的方法,即先将一个行计算查询分解为若干个子查询,分别针对每个子查询生成SQL语句,再将子查询的SQL语句组合在一起得到原始查询的SQL语句.在SOFT数据集上进行验证,结果显示,本研究所提的方法在复杂查询上效果优于已有方法.特别地,所提出的模型FinSQL能够较好地支持行计算查询.
|
关 键 词: | Text-to-SQL 自然语言查询 金融领域 行计算查询 分治方法 |
|
|