在新基准 BIRD 上,ChatGPT 仅能达到 40.08%,相比人类 92.96% 还有很大差距。 背景 大模型(LLM)为通用人工智能(AGI)的发展提供了新的方向,其通过海量的公开数据,如互联网、书籍等语料进行大规模自监督训练,获得了强大的语言理解、语言生成、推理等能力。
人们日常生活和工业生产中产生的海量数据被广泛存储于结构化数据库中,如何高效利用这些结构化数据成为近年学术研究和产业应用都十分关注的热点。 尽管直接编写SQL语句和数据库进行交互是目前最直接的方法,但是非计算机专业的从业人员需要耗费大量时间 ...
在企业数字化转型的浪潮中,我们发现很多公司依然面临着“数据深渊”:业务人员想看数据,却受限于复杂的 SQL 语法;开发者虽然尝试了 Text-to-SQL,但生成的代码逻辑常有偏差,同时也无法应对复杂的统计分析、根因定位等场景。 DataAgent 应运而生。 这不是 ...
本论文由北京大学与作业帮教育科技(北京)有限公司联合研发,核心团队长期深耕自然语言处理与数据库交互领域,聚焦大语言模型(LLMs)在结构化数据查询中的落地痛点。对比传统工作中将大型语言模型(LLM)看作一个一次性生成完整SQL代码的翻译器,本文 ...
当你的大模型在处理数据库查询时,是不是经常出现 “理解偏差”?比如把 “2020 年之后入职的员工” 错误解析成 “2020 年之前”,或者生成不存在的列名?这种 “思维混乱” 的背后,是传统 Text-to-SQL 技术遭遇的三大瓶颈:框架设计不完整、多代理协作不 ...
针对大语言模型(LLMs)在Text-to-SQL任务中的模型幻觉、错误传播及验证冗余问题,提出G2SQL框架,通过学习驱动的SQL计划反馈循环和审阅者-观察者机制,分阶段优化SQL生成与验证过程,确保安全性与效率。实验表明其执行准确率在BIRD数据集开发集达73.16%,Spider ...
针对传统SQL-to-text生成方法(如模板法、Seq2Seq模型)难以有效利用预训练语言模型的问题,研究人员提出新型SQL中间表示EzSQL,通过简化SQL语法结构(如用OR替代UNION)使其更贴近自然语言。基于BART的生成模型在WikiSQL和Spider数据集上实现SOTA性能,并成功提升Text-to ...
Swiggy 近日推出 Hermes V3,这是一款基于生成式 AI 的 Text-to-SQL 助手,员工可以直接用自然语言向数据发起查询。Hermes 运行在 Slack 中,通过向量检索、会话记忆、智能体编排以及解释层,将日常语言准确转化为可执行的 SQL 查询。 作为一家印度在线食品订购与配送 ...
2022世界人工智能大会(简称“WAIC2022”)在上海举行,容联云AI携重磅产品参与,全面展示了容联云知识图谱基于首创的DASH理念下“业务、算法、数据、人力”解耦合的低成本、可迁移的知识图谱解决方案,同时在WAIC 2022 黑客松大规模金融语义解析中文挑战赛中 ...