这项由明尼苏达大学双城分校、延世大学和Grammarly联合开展的研究,以预印本形式发布于2026年4月(arXiv编号:2604.10261),目前正在学术审议中。研究构建了一个名为"THE AMAZING AGENT RACE(AAR,神奇智能体竞赛)"的测试框架,用于系统评估AI智能体(即能自主使用工具完成任务的AI程序)在复杂任务中的真实能力。
Snowflake对Snowflake Intelligence和Cortex Code进行全面升级,旨在打造连接企业系统、数据源与AI模型的统一平台。Snowflake Intelligence将成为面向业务用户的智能工作助手,支持自然语言自动化任务、MCP连接器及可复用分析成果;Cortex Code则扩展为企业AI构建层,新增支持AWS Glue、Databricks等外部数据源及多种开发工 ...
最近,OWASP 发布了 Agentic Skills Top 10 (AST10) 项目。研究人员对当前生态中近 4000 个 Skill 进行了系统性扫描,结果令人心惊:超过 1/3 的 Skill 存在安全风险。 这意味着,当你为一个 ...
导语:2023年我们开始用 AI 辅助解决问题,2025 年我们验证了 AI Coding 的可行性,2026 年我们决定更进一步——不再让 AI 当"打字员",而是让它当"施工队长"。这篇文章记录了我们团队在 AI Native 研发模式落地过程中的思考、踩坑和最终形成的一套可复制的方法论。
在AI编程技术飞速迭代的2026年,Coding Plan平台已成为开发者提升编码效率、降低开发成本的核心工具。这类订阅制服务通过聚合主流大模型、提供高性价比调用额度和标准化API接口,彻底改变了传统编程模式,尤其在智能体开发、复杂代码生成和多模型协同场景 ...
IT之家4 月 1 日消息,科技媒体 Ars Technica 昨日(3 月 31 日)发布博文,报道称本地 AI 工具 Ollama 发布 0.19 预览版,全面接入苹果 MLX 机器学习框架,提升苹果 Mac 运行本地大模型速度。 本次更新深度优化统一内存的使用效率,改进缓存性能,并新增支持 NVFP4 模型 ...