python pytest - 搜索 News

2026-03-26-pytest-api-automation-framework.md

这里是我在测试开发领域的实战项目，全部来自于企业真实业务场景，具备完整的业务闭环与落地成果。 Wooshpay后台CRM客户管理系统、MBO审核系统是公司业务运营的核心系统，涉及多角色权限管理、敏感数据审核、全链路数据流转，业务功能更新频繁，每次版本 ...

Hacker

如何为 Trello Board 管理创建 Python CLI 程序（第 1 部分）

要运行我们的测试，只需运行 python -m pytest 。请注意我们的测试将如何失败，但这没关系 - 最终会成功。挑战角 💡你能尝试自己编写更多测试吗？请随意参考这个补丁来看看我的测试是什么样的现在，让我们构建 trelloservice 。

9 天

从“越用越好用”的 AI Agent 说起：测试开发如何打造自己的专属智能 ...

最近，一个名为 OpenClaw 的开源 AI Agent 框架在技术圈引发了不少讨论。很多人说它“越用越好用”，也有人吐槽“不好用”。作为一名测试开发工程师，我带着好奇读完了它的源码，发现了一个被大多数人忽略的本质——它的智能，不来自复杂的算法，而来自一堆普普通通的 .md 文件。这听起来有点反直觉，但背后的设计思想，恰恰是当前 AI 工程化落地非常值得借鉴的思路。本文将结合测试开发的实际工作 ...

腾讯网

SWE-bench满分，0个bug修复：伯克利造了个专门作弊的AI

【新智元导读】伯克利团队造了个专门作弊的AI，用10行Python代码拿下SWE-bench满分！500道题全过，0个bug修复。8大主流评测基准，全部沦陷。同一周，两份独立审计确认：排行榜上的作弊早已不是假设，而是现实。

腾讯网

深入源码：Hermes Agent 如何实现 “Self-Improving”

背景OpenRouter 排行榜上正在发生一场换代：Hermes Agent 增速 +204%，Top Coding Agents 排第一，Top Productivity 排第二。上线不到半年，GitHub 从 0 到 106k+ ...

4 天on MSN

AI评测信任危机：10行代码拿下SWE-bench满分主流基准集体“沦陷”

AI评测领域近日掀起轩然大波，多个主流基准测试的可靠性遭到严重质疑。伯克利大学研究团队通过开发自动化漏洞扫描工具，成功攻破八大权威评测体系，其中SWE-bench编程基准更被10行Python代码轻松破解，500道测试题全部获得满分却未修复任何真实漏洞。

GitHub

scruel/pcc_3e_slides

本仓库包含本人为《Python Crash Course》的中文版《Python 编程：从入门到实践（第三版）》所制作的配套图解讲义资源，与原书一起食用时效果更佳。本仓库可以算是本人为本书写的笔记，包含了本人阅读后的理解，但使用讲义形式发布。本讲义不仅可用于教学 ...

13 天

SWE bench,彻底废了！伯克利团队推出AI基准终结者！10行代码，所有 ...

博士生Hanchen Li和合作者Hao Wang等人发布名为“Terminator-1”的AI Agent，声称其在两大主流编码基准——SWE-bench Verified和Terminal-Bench上取得95%以上的高分，甚至部分达到100%。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果