赞
踩
论文:A comprehensive evaluation of ChatGPT’s zero-shot Text-to-SQL capability
⭐⭐⭐⭐
arXiv:2303.13547
这篇论文呢综合评估了 ChatGPT 在 zero-shot Text2SQL 任务上的表现。
dataset 使用了 Spider、Spider-SYN、Spider-DK、Spider-Realistic、Spider-CG、ADVETA、CSpider、DuSQL、SParC 以及 CoSQL。
由于 ChatGPT 生成的 SQL 多样性,所以这里主要使用了 execution accuracy 作为 metric。
下图展示了使用 ChatGPT 来做 Text2SQL 的 prompts:
这里主要使用了三个 evaluation metric:
整体上来说,ChatGPT 表现出很强的 Text2SQL 能力。
下面总结一些结论:
做了一些 case study,发现 ChatGPT 总在一些小细节上犯错,论文给出了 4 个 error case:
可以看出,ChatGPT 在 Text2SQL 任务上表现还不错,但仍然有不少的提高空间:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。