最近,有人曾问笔者这样一个问题:既然有了大模型,直接用它合成数据就能快速生产,那还需要人工标注数据吗? 现在数据生产确实是这么干的,模型蒸馏已经成了行业里公开的秘密。让强模型出题,弱模型跟着学,几行配置,几百张卡挂机跑几天,就能刷出 ...