在人工智能的世界里,让模型“举一反三”一直是研究者们追求的目标。比如训练好的图像分类模型,能从标注好的“源域”数据,无缝适配到没标注的“目标域”数据,这就是无监督域适应(UDA)的核心诉求。但长期以来,视觉-语言模型(VLM)在域适应任务中,始终被“模态间隙”这个难题绊住脚步。 最近,一篇名为《Unified Modality Separation: A Vision-Language Frame ...
这些表情文字本质上是人类为了弥补文字交流的情绪缺失而发明的 "副语言",没有实际语义,只传递语气和情绪。但它们由字母、标点、符号拼接而成,恰好和编程语言、系统命令的核心语法高度重合: ...
这套思路对强模型和弱模型的价值不同。强模型通常能靠自身能力绕过一些环境错误和执行偏差,但代价是更多token、更多工具调用和更长耗时。弱模型、本地模型和开源模型更依赖系统层补偿:路径要更明确,依赖要提前处理,输出格式要被约束,复杂流程要拆成它能稳定执 ...
但有一个人做了件反直觉的事。 Sigrid Jin ——被《华尔街日报》报道的 Claude Code 全球头号 重度用户,一个韩裔加拿大开发者,曾在过去一年单枪匹马烧掉了 250 亿 Token(按 Claude API 定价折算超过百万美元)——他完全不碰泄露的源码,用自己调教一年多的 AI 代理框架 oh-my-codex,几小时内从零用 Python “净室重写”了一遍。他把成果发到 ...
姚顺雨交出了加入腾讯后的第一份模型答卷。 4 月 23 日,腾讯混元 Hy3 preview 语言模型发布并开源。这是一款主打快慢思考融合的 MoE 语言模型,总参数 295B,激活参数 21B,最大支持 256K ...
AI 快用不起了。大模型机构密集发出“涨价信号”。 在国内,智谱 4 月 8 日随 GLM-5.1 新模型发布同时宣布涨价 10% ——这是它 2026 年内第三次涨价,CEO 张鹏的解释很直白:“公司存在算力约束和瓶颈。”一周后,大洋彼岸的 ...
在自动驾驶领域,视觉-语言-动作(Vision-Language-Action, VLA)模型正逐渐成为研究的热点。这类模型试图将大语言模型(LLM)丰富的世界知识引入驾驶系统,赋予车辆更强的认知和推理能力。然而,现有的 VLA 模型面临着一个尴尬的 ...
姚顺雨(1998年生)的履历自带「天才少年」标签,但客观来看,他的技术背景与腾讯当时的AI需求高度契合,这也是腾讯重金挖角的核心原因——腾讯此前混元负责人张正友(深耕计算机视觉领域)、蒋杰(侧重大数据方向)均非NLP/LLM原生背景,而姚顺雨是腾讯首 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果