OmniSQL:将自然语言转化为高质量SQL查询的模型

OmniSQL 是一个开源项目,由 RUCKBReasoning 团队开发,托管在 GitHub 上。它的核心功能是将用户输入的自然语言问题转化为高质量的 SQL 查询语句,帮助用户轻松与数据库交互。项目基于一个自动化的文本转 SQL 数据生成框架,推出了包含 250 万条样本的 SynSQL-2.5M 数据集,这是目前最大的跨领域合成文本转 SQL 数据集。OmniSQL 提供 7B、14B、32B 三种模型规模,适合不同需求的用户。无论是数据分析、数据库管理,还是模型研究,它都能提供强大支持。项目使用 Apache 2.0 协议,用户可以免费下载并参与改进。

>>展开阅读