SheepNav
新上线16天前84 投票

DeepSeek V4 发布:开源模型让前沿实验室感到恐惧

DeepSeek V4 以 MIT 许可证发布,API 价格仅为每百万输出 token 0.30 美元,比 Claude Opus 4.7 便宜 83 倍,同时在 SWE-bench Verified 上取得 80.6% 的得分。这款开源模型在编码任务上表现卓越,LiveCodeBench Pass@1 达到 93.5%,Codeforces 评分 3206,超越 GPT-5.4 xHigh 和 Gemini 3.1 Pro。其 1.6 万亿参数 MoE 架构每次 token 仅激活 490 亿参数,推理 FLOPs 降至 V3.2 的 27%,KV 缓存占用仅为上一代的 10%。低成本并非促销手段,而是基于高效的推理架构。尽管存在基准测试透明度、数据治理和自托管门槛等注意事项,DeepSeek V4 已证明代理编码不再是闭源模型的护城河。

延伸阅读

  1. NumLeak:公开数值基准竟成基础模型“潜标签”,前沿大模型记忆能力惊人
  2. MADQI:面向AIS船舶异常检测的无监督学习新评估指标
  3. 突破 fMRI 数据瓶颈:双谱流匹配模型生成高保真脑功能时序数据
查看原文