不仅为 AI Agent 安全评测提供了高保真、低成本、自动化的解决方案,还揭开了一个惊人的真相:在诱惑与压力面前,现有模型普遍存在“对齐幻觉”,风险率从 21.7% 飙升至 54.5%。
【新智元导读】太疯狂了!Anthropic刚刚发布Claude Code新版,上线神秘功能Routine:支持定时、API、GitHub三路触发,直接变身「云端员工」。更刺激的是,Opus 4.7即将本周闪电发布,直接跨界硬刚Adobe、Figma。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果一些您可能无法访问的结果已被隐去。
显示无法访问的结果