而整个测试,我全都是让 Claude Code(Opus 4.7)自己完成的:让它自己设计测试方案,自己写 prompt,分别使用 GLM 5.1 和 DeepSeek V4 Pro 跑同样的任务,最后自己评判结果。
智谱AI GLM Coding Plan 是一款专为 AI 编程打造的订阅套餐,由清华大学计算机系技术成果转化而来。该套餐基于智谱最新的旗舰模型 GLM-4.7(前身为GLM-4.6、GLM-4.5),月费最低仅需 20 元,就能在 Claude Code、Cline、Cursor、Roo Code、Kilo Code 等 10+ 款主流 AI 编程工具中畅享智能 ...
零人工介入,能独立工作超过 8 小时,GLM-5.1 从零交付了一套完整的 Linux 桌面系统:窗口管理器、文件浏览器、终端、文本编辑器、系统监视器、游戏库等,共计 4.8MB GLM-5.1 能够在长时间任务中持续保持有效工作,这让它可以做到以前短对话里做不了的事情。
过去很多团队评估 AI,重点还是回答质量、推理能力、上下文长度和调用成本。现在越来越多产品开始强调长任务、持续运行、工具调用、状态管理、自动修复和本地部署。这意味着行业竞争的重心,正在从模型单点能力,转向系统级可交付能力。
快科技 3 月 27 日消息,距离春节前夕发布 GLM-5.0 只有 1 个多月时间,智谱今晚突然发布了改进版的大模型 GLM-5.1,现已面向 GLM ...
近期,被Anthropic那篇长周期应用开发的Harness设计博客刷屏了,这套思路确实漂亮——让规划Agent拆任务、生成Agent写代码、评估Agent验收,形成一个闭环。 这些本质是给模型的弱点打补丁,我当时的想法是:如果模型本身够强,这些Harness可以拆掉一半了。
前述内容由第一财经“星翼大模型”智能生成,相关AI内容力求但不保证准确性、时效性、完整性等。请用户注意甄别,第一财经不承担由此产生的任何责任。 如您有疑问或需要更多信息,可以联系我们 yonghu@yicai.com GLM-4.7-Flash发布并开源 据智谱公众号,GLM-4.7 ...
Toyama nao表示 GLM-5.1的大幅扩展了编程的适应范围,不再是前端only战神,也不只是oneshot 样子货,是可以在复杂工况下充当编程主力。 当然,GLM-5.1也不是没有问题, 他提到的是超长上下文时容易幻觉爆炸, 如果遇到2轮改不好一个问题,不要抱有侥幸,直接重开。
IT之家4 月 8 日消息,智谱今天正式发布新一代旗舰模型 GLM-5.1。华为官方宣布,智谱 GLM-5.1“Day0”上线华为云。 据介绍,智谱 GLM-5.1 在昇腾算力上实现了 Layer 级 MOE 绝对均衡,通过框架能力优化让专家均衡产出 Token,同时结合昇腾 Attention 算子特征,通过推理 ...
目前仅次于Opus 4.6的Sonnet4.6模型了?? 要是这样的话...那网友们直接反手就是一个实测大整活儿!! 看下面这位小哥,连夜搓出来了个AI版「我的世界」,还能带交互的内种,有点大型游戏那味儿了啊: 还有网友直接把模型安排到自己日常工作流里了。 下面这 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果