DeepSeek联合北大发布DSpark框架:大模型推理速度提升60%–85%
6月27日,联合理速DeepSeek团队与北京大学联合发布《DSpark》研究论文,发布该成果聚焦于推测解码(Speculative Decoding)领域,框架提出了一种革新性的大模度提方法以大幅加速大语言模型的推理过程。
针对现有并行“草稿生成”技术中因Token间关联性薄弱导致拒绝率升高及验证算力浪费的型推问题,DSpark创新性地引入了半自回归架构。升–通过在并行生成主干中嵌入轻量级顺序模块,联合理速该框架有效强化了Token间的发布依赖关系,从而显著提升了草稿生成的框架质量。
此外,大模度提DSpark构建了“基于置信度的型推动态验证机制”。该机制能够根据请求的升–成功概率及系统实时负载,自适应地调整验证长度,联合理速进而最小化无效计算开销。发布离线测试数据显示,框架该方法大幅增加了可接受的生成长度;而在DeepSeek-V4线上部署中,相较于基线模型,推理速度实现了60%–85%的显著提升,并有效缓解了高并发场景下的吞吐量衰减问题。
为促进行业技术演进,论文已同步开源模型检查点及训练框架DeepSpec,旨在推动社区在相关方向的深入研究。
(责任编辑:休闲)
推荐文章
-
日前,车质网获取了斯柯达Peaq的内饰官方设计图。作为基于MEB+平台打造的纯电7座中大型SUV,斯柯达Peaq定于欧洲时间6月23日正式全球首发。从曝光的内饰图来看,斯柯达Peaq遵循简约规整的布局
...[详细]
-
图为尊界V800记者 周信6月25日晚,上海张江科学会堂灯火通明,鸿蒙智行尊界品牌盛典在此拉开帷幕。华为常务董事、终端BG董事长余承东登台,在前20分钟里,他近乎机械地照着提词器逐字宣读稿件,这种罕见
...[详细]
-
《乘风2026》总决赛成团:范玮琪哽咽感谢大S,与天上的大S对话
6月27日,《乘风2026》总决赛圆满落幕。在随后的群星访问环节中,范玮琪情绪彻底决堤,多次哽咽落泪,最终在成团采访环节向已故挚友大S徐熙媛)深情告白。在舞台最后的采访环节,范玮琪终于卸下防备,将积压
...[详细]
-
随着暑期档全面升温,全球电影市场重现蓬勃生机。上周末,皮克斯经典IP《玩具总动员5》Toy Story 5)在北美、中国等全球多地同步上映,首周末狂揽3.12亿美元全球票房,一举刷新2026年全球电影
...[详细]
-
“人造太阳”重要突破!我国自主研制 全球最大核聚变堆超导磁体通过验收
近日,我国在核聚变能源领域取得里程碑式突破。由我国自主研制的、目前全球规模最大的核聚变堆超导磁体系统,正式通过项目验收。这一成果标志着我国在可控核聚变关键核心技术攻关上迈出了坚实一步,为未来建造商用聚 ...[详细]
-
兰州大学回应“学术论文出现AI水印”:已成立专项调查组启动调查
北京商报讯记者 吴其芸)6月28日,针对网络流传的“学术论文出现AI水印”争议,兰州大学发布官方情况说明。校方表示,高度重视网民关于本校教师杨某某相关论文问题的反映,已第一时间成立专项调查组启动全面调 ...[详细]
-
预见时代,必被时代铭记。在北京楼市的版图中,嘉棠系每一次亮相,皆是一场全城瞩目的现象级事件。从怀柔到丰台双子星,其市场号召力早已得到验证。作为嘉棠系第三座全新力作,嘉棠雅序自亮相以来,历经售楼处开放、
...[详细]
-
“娱乐大众,不是闷死大众。”“这是保生存的时代,不是保理想的时代。”“他俩能这样爱我已经很好了。”在长达3小时57分的《言外之易》第二期节目中,那个在短视频里以“搞抽象”著称的向佐消失了。取而代之的,
...[详细]
-
高中女同学当年给我塞了3年饭票,如今知她落魄,我主动找上了门
"你是...陈远?"门缓缓打开,一个面容憔悴的女人惊讶地看着我。"是我,李雯。好久不见。"我微笑着回应,心中却泛起层层涟漪。李雯愣了一下,随即慌乱地整理着自己凌乱的头发,"你怎么会来这里?"01199
...[详细]
-
每天1300部AI短剧上线 投流成本持续攀升“堆量”难以为继
图为短剧拍摄现场。 时报财经图库/供图证券时报记者 吴志随着视频生成模型的迭代升级与智能制作工具的普及,国内短剧产业正加速向“AI化”转型。目前,AI短剧已占据行业绝对主流地位,成为内容供给的核心力量 ...[详细]
热点阅读

白玉兰奖落幕,3人口碑暴涨,2人升咖,1人镀金失败,唯她被骂惨
等《人生切割术》第三季?这部8集科幻神作是完美替代
全球首发!冰箱彩电大沙发之后,20秒一键自动生成的“大床”也给您安排了
美媒:一小型飞机在美国马里兰州坠毁,3人死亡
被40万人追更的火焰魔术师,重塑古老灯工玻璃
