首页
热点
百科
娱乐
科技
资讯
药品
美容
时尚
登录
标签
吞吐量
突破扩散LLM瓶颈,英伟达港大提全新Fast-dLLM,推理加速27.6倍!
这是一张来自Fast‑dLLM论文的综合性能图,分成 (a)、(b)、(c) 三个小面板,直观展示了在GSM8K推理任务上,给扩散大模型(LLaDA 和 Dream)外挂KV Cache与并行解码之后,速度…
推理
FastdLLM
速度
模型
吞吐量
fjmyhfvclm
17小时前
5
0