知乎专栏 on MSN
32B大模型Text2SQL微调——项目复盘
本文将分享一个医疗数据分析领域的 Text2SQL 项目。这是我第一个 Text2SQL 项目,算是这个场景中的新手,踩了不少坑,刚好和大家分享。 背景:客户内部有几十个业务数据库,分析师每天要写大量 SQL。需要构建自然语言转 SQL 的工具——用户用中文提问,系统自动生成 SQL 查询。 由于数据库 schema ...
InfoQ中国 on MSN
工业级 LLM 数据工程:北京大学 DCAI 团队 DataFlow 框架的架构设计与实践
在大模型(LLM)研发进入深水区的 2026 年,行业共识正经历从“模型中心(Model-Centric)”向“数据中心(Data-Centric)”的深刻演进。随着 Scaling Law 进入平台期,开发者发现:单纯堆砌 Token 数量已边际效应递减,数据的语义密度(Semantic Density)与工程精度成为了突破模型性能上限的关键。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果