GLM Python - 搜索 News

我让 Claude Code 当裁判，横评 DeepSeek V4 和 GLM-5.1

而整个测试，我全都是让 Claude Code（Opus 4.7）自己完成的：让它自己设计测试方案，自己写 prompt，分别使用 GLM 5.1 和 DeepSeek V4 Pro 跑同样的任务，最后自己评判结果。

一些您可能无法访问的结果已被隐去。