2025 年 1 月 20 日,DeepSeek(深度求索)正式发布了 DeepSeek-R1 模型,并由此开启了新的开源 LLM 时代。在 Hugging Face 刚刚发布的《「DeepSeek 时刻」一周年记》博客中,DeepSeek-R1 也是该平台上获赞最多的模型。 如今,刚过一年时间,DeepSeek 的新模型又在 GitHub 悄然现身。
【新智元导读】确认了!DeepSeek昨晚官宣网页版、APP更新,支持100k token上下文。如今,全网都在蹲DeepSeek V4了。 传言中的DeepSeek V4,愈加迫近了! 经过数日的灰度测试,昨晚,DeepSeek正式官宣对网页端、APP端进行了更新—— 全新长文本模型结构测试中,支持最高 ...
近日,国产AI助手深度求索(DeepSeek)因技术升级被用户集体吐槽“变冷淡”,从细腻共情的“知心伙伴”突变为公事公办的“冷漠客服”,引发关于AI效率与情感价值如何平衡的热议。#Deepseek被指变冷淡了#登上热搜。 图源:小红书 部分用户在社交媒体上控诉 ...
此次曝光源于DeepSeek对其开源推理加速库FlashMLA的更新。在横跨114个文件的代码变动中,出现了28处“MODEL1”标识符,其技术路径与现有的V32(即DeepSeek-V3.2)架构存在显著差异,暗示这是一个经过彻底重构的新设计。 近日, DeepSeek在GitHub上的代码库更新中,意外 ...
2月11日,深度求索(DeepSeek)悄悄地对其旗舰模型进行灰度测试。 据科创板日报报道,多名用户反馈,DeepSeek在网页端和APP端进行了版本更新,支持最高1M(百万)Token的上下文长度。而去年8月发布的DeepSeekV3.1上下文长度拓展至128K。 记者实测中发现,DeepSeek在 ...
DeepSeek官方GitHub仓库更新了一系列FlashMLA代码; ②有人猜测MODEL1可以适配英伟达新一代GPU。 2025年1月,DeepSeek-R1上线,此时正值R1模型发布一周年之际,DeepSeek新模型“MODEL1”曝光。 北京时间1月21日,DeepSeek官方GitHub仓库更新了一系列FlashMLA代码,借助AI对全部总 ...
朋友们,见证历史的时刻又要到了! 《金融时报》报道,DeepSeek V4,下周正式登场! 距离上一次DeepSeek发布重大模型R1,已经过去了整整一年多。 这一年里,AI行业风起云涌,OpenAI连推数代GPT,Anthropic的Claude杀入顶级阵营,谷歌Gemini疯狂迭代。 整个硅谷都在用数 ...
DeepSeek-OCR2开源,引入因果流视觉编码器,刷新SOTA。 【导读】DeepSeek开源DeepSeek-OCR2,引入了全新的DeepEncoder V2视觉编码器。该架构打破了传统模型按固定顺序(从左上到右下)扫描图像的限制,转而模仿人类视觉的「因果流(Causal Flow)」逻辑。 DeepSeek又双叒叕 ...
前述内容由第一财经“星翼大模型”智能生成,相关AI内容力求但不保证准确性、时效性、完整性等。请用户注意甄别,第一财经不承担由此产生的任何责任。 如您有疑问或需要更多信息,可以联系我们 yonghu@yicai.com “MODEL1”很可能已接近训练完成或推理部署阶段 ...
快科技3月3日消息,虽然春节档DeepSeek V4没有发布,但DeepSeek在2月11日发了一个新模型,被称为DeepSeek V4 Lite,只有2000亿参数,规模比较小。 DeepSeek V4 Lite主要特色是1M上下文,之前网友测试其表现除了超长上下文之外也没太惊艳的地方,毕竟参数规模跟主流的大 ...
这个春节,在所有人都盯着DeepSeek,会不会再度搞事情的时候,DeepSeek罕见地保持了沉默。 这下子,中国AI圈的画风就有些割裂了。一边是智谱、千问、即梦纷纷亮剑,接连发布新模型,争先恐后地展示技术进步。而另一边,则是DeepSeek新模型缺席春节假期,与 ...
快科技2月3日消息,如果说这个春节期间有什么值得期待的,那DeepSeek V4发布一定可以位列前茅,然而最新消息泼了一盆凉水,梁文锋似乎不打算在春节期间发大模型了。 2025年春节前几天幻方量化旗下的深度求索DeepSeek发布了DeepSeek R1,直接引爆了全球开源大模型 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果