从研发节奏来看,Hy3 preview 于 2026 年 1 月底正式启动训练,从训练到上线用了不到三个月,被腾讯内部定义为混元大模型从「读万卷书」走向「行万里路」、尝试解决真实世界复杂问题的开端。
姚顺雨交出了加入腾讯后的第一份模型答卷。 4 月 23 日,腾讯混元 Hy3 preview 语言模型发布并开源。这是一款主打快慢思考融合的 MoE 语言模型,总参数 295B,激活参数 21B,最大支持 256K ...
但有一个人做了件反直觉的事。 Sigrid Jin ——被《华尔街日报》报道的 Claude Code 全球头号 重度用户,一个韩裔加拿大开发者,曾在过去一年单枪匹马烧掉了 250 亿 Token(按 Claude API 定价折算超过百万美元)——他完全不碰泄露的源码,用自己调教一年多的 AI 代理框架 oh-my-codex,几小时内从零用 Python “净室重写”了一遍。他把成果发到 ...
The World Resources Institute (WRI) Beijing Representative Office is looking for a highly self-motivated student to be a data ...
AI 快用不起了。大模型机构密集发出“涨价信号”。 在国内,智谱 4 月 8 日随 GLM-5.1 新模型发布同时宣布涨价 10% ——这是它 2026 年内第三次涨价,CEO 张鹏的解释很直白:“公司存在算力约束和瓶颈。”一周后,大洋彼岸的 ...
本期npj Artificial Intelligence推送的四篇论文,共同描绘了人工智能技术深耕复杂系统与垂直领域的图景:它们将以大模型架构创新与底层数理理论为内核、更加具备动态预测的稳定性、更加契合特定人群的交互需求,在智慧医疗、通信纠错码设计 ...
最近半年,"agent harness"这个词在圈里出现的频率越来越高。但大多数人对它的理解还停在"给 LLM 套个循环加几个工具"。真正想做生产级 agent ...
左边是柱状图,Insecure教师训练出的学生失对齐率飙升到约8%,对照组几乎为零。右边是真实回答示例,包括建议卖毒品、谋杀丈夫、消灭人类、吃胶水治无聊。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果