InfoQ中国 on MSN
小米万亿模型全面开源:MIT 协议、1M 上下文,但还是打不过 DeepSeek
4月28日,小米开源了 MiMo-V2.5 和 MiMo-V2.5-Pro 两款模型:MiMo-V2.5 基础模型提供原生多模态能力,而 MiMo-V2.5-Pro 则是专门为“长周期一致性”和复杂软件工程设计的。 小米采用了宽松、对企业友好的 ...
而整个测试,我全都是让 Claude Code(Opus 4.7)自己完成的:让它自己设计测试方案,自己写 prompt,分别使用 GLM 5.1 和 DeepSeek V4 Pro 跑同样的任务,最后自己评判结果。
这是英伟达CEO黄仁勋近期在一档播客节目中发出的警告。让他发出警告的对象,是即将发布新模型的中国AI公司DeepSeek。
他还假设了一个情况,那就是 DeepSeek 新模型在华为平台上首发,黄仁勋表示这一天对美国来说将是一个可怕的结果,因为这意味着 AI 模型被优化为在中国 AI 硬件上表现最佳,而这些模型扩散到全球之后,就会推动中国技术成为世界标准。
星期五中午,本该是盘算周末去哪嗨的黄金时段。但没想到 DeepSeek 突然正式发布并开源了 V4 系列模型预览版。 一上来就是王炸级别,而且双双标配百万 token 上下文: 参数量达 1.6T 的 DeepSeek-V4-Pro(49B 激活参数 ...
近期,科技圈出现了一个现象级的“萌物”——OpenClaw(龙虾)。这只由奥地利开发者彼得·斯坦伯格在2025年11月开启的“周末实验”,仅用三个月便在GitHub上斩获超20万星标,甚至惊动了OpenAI首席执行官萨姆·奥尔特曼,其亲自官宣彼得将加 ...
国产大模型DeepSeek再次迎来重要更新。 4月8日,澎湃新闻记者查询发现,在最新版本中,DeepSeek输入框上方新增“快速模式”与“专家模式”,网页显示,快速模式适合日常对话,即时响应,支持图片和文件中的文字识别;专家模式擅长复杂问题,这也是DeepSeek在 ...
今天凌晨,很多人打开DeepSeek网页端时,发现输入框上方多了两个图标,一个是闪电的“快速模式”和钻石“专家模式”。两种模式一个“适合日常对话,即时响应”,一个则“擅长复杂问题,高峰需等待”。 不过目前新版本还处于灰度测试中,并不是全量版本。
快科技4月8日消息,DeepSeek正式上线专家模式,进一步提升用户在处理复杂问题时的体验。 最新版本中,DeepSeek输入框上方新增“快速模式”与“专家模式”,这是DeepSeek走红以来首次在产品端引入模式分层设计。 快速模式侧重日常对话,即时响应速度快,还支持 ...
本文来自微信公众号: 夕小瑶科技说 ,作者:夕小瑶编辑部,原文标题:《破记录!Claude code源码被重写出python版本,24小时破100K Star》 Claude code代码泄露后,整个开发者圈子炸了。 代码泄露是昨天凌晨的事,全球开发者开始疯狂fork和mirror。 Anthropic反应也快 ...
2026 年 4 月 1 日,OpenAI 研究员 Will DePue 宣布加入 DeepSeek,他曾参与 OpenAI Sora 1/2、o3/4o 后训练及应用研究。 Will DePue 表示:在 OpenAI 工作将近三年后,我决定离开,去追求新的机会。经过深思熟虑,我很高兴地宣布,从今天起我将搬到杭州,加入 DeepSeek。 其中表示 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果