deepseek参数量级

说一布二 1天前

DeepSeek模型系列涵盖多个参数量级,不同版本覆盖的“b”模型略有差异,整体包含1.5B、7B、8B、14B、32B、70B、671B这几种 。
 
其中1.5B是极轻量型,适配移动端等资源受限设备;671B是超大规模MoE架构模型,对标GPT - 4,需分布式集群支撑;像7B、14B这类中等参数量模型,则是兼顾性能与资源消耗的主流选择,适合中小企业和多数常见复杂任务 。

没啥想说的

最新回复 (0)
全部楼主

你可以在 登录注册 后,对此帖发表评论!

返回
发新帖