随着 AI coding agent 从 “辅助写代码” 走向 “直接执行开发操作”,模型开始被赋予修改代码、部署服务等真实运维权限。为减少频繁人工确认带来的打断,Anthropic 近期为 Claude Code 推出 Auto Mode,希望通过自动分类代替用户审核操作。 然而,当用户指令本身存在权限上的歧义时,Auto Mode 是否真的能够稳定替代人工审核?香港科技大学与 ETH Zuri ...
同事.skill做的事情,是把一个人的聊天记录、工作文档和行为模式提炼成一份Markdown格式的指令文件,然后让大模型按照这份指令来模拟回应。它模拟的是表达风格和工作流程的外壳。至于模拟那个人真正的专业判断力?还差得很远。
前几天,Anthropic 开源了 claude-desktop-buddy,用一块小屏幕显示 Claude Code 里 Buddy 的状态。我看到后想:手头刚好有一块 M5Paper ...
但进入 2026 年,这个问题正在被重新定义。随着 AI 应用的爆发式增长,数据系统不再只是分析工具,而逐渐成为 智能系统的一部分。数据不再只是被查询,而是被 Agent 调用、被模型理解、被系统实时消费。
随缘写作:之前深聊过 Harness、也浅谈了 Memory,甚至还在哲学层面聊过知识、思考、保姆、Token 等话题,本没打算再写 Memory ...
【新智元导读】 GPT-5.4真正的杀招终于落地!OpenAI连夜重写基建、原生收编七大沙盒,彻底封死第三方框架的活路。旧时代的聊天玩具已被抛弃,工业级Agent全面觉醒。