DeepSeek最新论文:如何让大模型跑得更快?梁文锋署名
当行业焦点仍停留在“谁的最新模型更聪明”时,DeepSeek已将目光转向更具现实意义的论文命题:如何让模型运行得更快。
6月27日,何让DeepSeek在GitHub低调更新了一篇最新技术论文,大模得更正式介绍其推理加速框架 DSpark。型跑该框架旨在突破大语言模型在高并发场景下的快梁推理效率瓶颈。
从作者署名来看,文锋该成果由 DeepSeek与 北京大学联合发布,署名DeepSeek创始人 梁文锋赫然在列。最新论文不仅开源了DSpark模型权重,论文还同步发布了面向推测解码、何让由算法驱动的大模得更训练代码仓库 DeepSpec。

DeepSeek最新论文截图
此次发布延续了DeepSeek一贯的型跑“硬核技术派”风格,论文标题《DSpark:基于置信度调度的快梁半自回归生成推测解码》(DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation)虽显晦涩,却直指核心痛点。文锋
痛点:自回归生成的效率瓶颈
论文首先剖析了大语言模型(LLM)的核心性能瓶颈。传统LLM采用自回归方式生成文本,即每一个新词元(token)的生成,都需基于所有前置词元完成一次完整的前向传播。这种机制导致:
* 输出越长,等待越久;
* GPU利用率低下;
* 用户等待时间过长。
这在实时对话助手、多轮智能体工作流等对低时延敏感的场景中尤为突出。
目前主流解决方案主要分为两条路线:
1. 自回归草稿模型(如Eagle3)
2. 并行草稿模型(如DFlash)
然而,现有方案均存在生成质量瓶颈、系统效率瓶颈,且普遍缺乏负载自适应校验机制。
方案:DSpark的半自回归架构
针对上述缺陷,DeepSeek提出了 DSpark推测解码框架。该框架采用半自回归架构,通过两套互补机制,巧妙解决了草稿生成与校验环节之间的权衡矛盾,将高吞吐并行生成与自适应负载感知校验机制融为一体。
实测数据:性能显著提升
根据论文披露的受控离线基准测试数据(涵盖数学推理、代码生成、日常闲聊三类任务),DSpark框架相较于自回归草稿模型与并行草稿模型,在单轮平均可接受词元长度上实现了大幅提升。
1. 在线服务实测(DeepSeek-V4)
DeepSeek已将DSpark部署至DeepSeek-V4在线服务系统,基于真实用户流量评估其实际性能。结果显示,在相同吞吐量条件下,相较于现有生产环境基线系统 MTP-1,DSpark将用户端生成速度提升了60%-85%。
2. 跨模型通用性验证
此外,团队将该框架部署于阿里通义千问(Qwen3)系列模型(4B、8B、14B)上,验证了其通用性:
* 对比自回归草稿模型:Qwen3-4B、8B、14B的单轮可接受词元长度分别提升 30.9%、26.7%、30%。
* 对比并行草稿模型:上述模型分别提升 16.3%、18.4%、18.3%。
行业意义:算法创新与开源初心
从技术视角看,这篇论文的核心价值在于通过算法创新显著提升了模型的推理生成速度。在大模型行业逐渐走向落地应用的当下,“更便宜、更快速”的输出能力已成为关键竞争力。
同时,DeepSeek通过全面开源,再次推动了社区发展。社交平台上的开发者评价道:“AI Infra再次被DeepSeek加速了。”
也有用户指出,DeepSeek最令人钦佩之处在于其模型迭代与推理基础设施的同步更新:在发布V4时,不仅提供了论文和代码,还验证了跨模型的通用性。
尽管近期融资消息不断,未来可能面临商业化压力,但通过此次开源,DeepSeek似乎在向业界证明:它仍坚持着开源的初心。
(责任编辑:休闲)
-
在2026年世界杯1/16决赛的焦点战中,加拿大国家队凭借一粒补时阶段的进球,以1-0力克南非队,成功晋级十六强。打入制胜球的加拿大中场核心欧斯塔基奥,凭借决定性表现当选本场比赛官方全场最佳球员。面对
...[详细]
-
耐克广告翻车,陷抄袭争议,C罗海报被指撞款李宇春演唱会主视觉
耐克再度卷入抄袭争议。6月24日凌晨,葡萄牙球星C罗攻入本届世界杯首球,耐克随即发布致敬海报,配文“连续六届,破门从未缺席,仅此一个”,并@C罗。海报以纯白为底,左右两侧并列C罗不同时期人像;视觉中心
...[详细]
-
刚需置业丰台:方程国贤府VS熙悦晴翠,谁才是2026年的“上车”优选?
❀ 深度置业解析 ❀2026丰台刚需优选:方程国贤府 VS 熙悦晴翠在2026年北京楼市“刚需与刚改主导”的市场格局下,丰台区园博园板块已成为置业焦点。对于预算在 350万-500万区间、渴望坚守城六 ...[详细]
-
大衣哥再次登上热搜!演出结束后与友人聚餐,面前放满光瓶白酒,引网友热议
六月菏泽,暑气蒸腾。一家路边小馆内,塑料门帘半掩,吊扇嗡嗡作响。朋友随手拍下的一张照片,让“大衣哥”朱之文再次登上热搜。没有精致的摆盘,没有昂贵的酒水,桌上堆满了牛栏山、红星二锅头等光瓶白酒的空瓶,菜 ...[详细]
-
界面新闻记者 | 林倩冰人工智能、区块链等前沿技术的爆发式增长,正在深刻重构金融服务的底层逻辑与行业生态格局。近日,赛迪智库中小企业研究所联合网商银行发布的《AI时代小微经营者观察》报告指出,在AI时 ...[详细]
-
泰王玛哈与苏提达王后携思蕊梵公主乘坐专机抵达法国,开启为期4天的国事访问。此前皇室消息已确认,此次出访由国王夫妇与公主同行。据泰国媒体报道,抵达机场后,思蕊梵公主先行下机安排接待事宜,随后再次登机,以
...[详细]
-
44岁彭于晏伦敦路人抓拍火遍全网,银发少年感爆棚,拍戏彻底停工
6月底,伦敦街头一家平价越南粉店内,44岁的彭于晏被游客捕捉到一组无滤镜生图。照片中,他一头银灰短发搭配均匀的小麦色肌肤,官方身高182cm的他在一众欧洲路人中显得格外挺拔,视觉冲击力极强。此次行程中
...[详细]
-
齐鲁网·闪电新闻6月23日讯 随着暑运高峰临近,青岛机场迎来新一轮航线密集开通与加密期。自7月10日起,青岛至敦煌直飞客运航线正式启航。这条新航线不仅架起了黄海之滨与丝路明珠之间的便捷空中桥梁,更为两
...[详细]
-
AI眼镜仍处 “黑莓时代”:封闭生态VS开放体系 谁能率先跑出行业“iPhone时刻”?
“我们曾反复预言明年是AI眼镜元年,但今天可以确信:火箭已点火升空,质疑其能否起飞的时代已经结束。”6月26日,在杭州举行的“乐奇Rokid Open Day 2026生态及开发者大会”上,Rokid
...[详细]
-
2026年6月28日刊 | 总第4375期 编者按在第31届上海电视节“白玉兰绽放”颁奖典礼上,演员董勇凭借电视剧《太平年》中冯道一角的精湛演绎,成功斩获最佳男配角奖。此前,董勇曾凭借现象级剧集《繁花
...[详细]

尊界冲刺138.8万元 余承东照着提词器念了20分钟
《爱情有烟火》直到廖诗语自首,钱菲才发现,姚晶晶出卖她的真相
众明星纷纷给《抓特务》包场!韩红终于能“走个面”了……
网传纯净水涨价,娃哈哈回应
全行业出清:他们终于把自己玩死了
