DeepSeek再放大招,推理速度狂飙85% 怎么做到的?
cnBeta.COM.TW RSS订阅ugmbbc1小时前
6月27日,DeepSeek公开DSpark技术报告和DeepSpec代码库。DeepSeek-V4的底座模型没有变,新增的是一个服务端推测解码模块:DSpark。DeepSeek在HuggingFace模型页里把话说得很直白:V4-Pro-DSpark和V4-Flash-DSpark"不是新模型"。这两个页面指向的是同一个模型检查点,加上推测解码模块后的服务版本。 阅读全文