DeepSeek模型系列涵盖多个参数量级,不同版本覆盖的“b”模型略有差异,整体包含1.5B、7B、8B、14B、32B、70B、671B这几种 。 其中1.5B是极轻量型,适配移动端等资源受限设备;671B是超大规模MoE架构模型,对标GPT - 4,需分布式集群支撑;像7B、14B这类中等参数量模型,则是兼顾性能与资源消耗的主流选择,适合中小企业和多数常见复杂任务 。
你可以在 登录 或 注册 后,对此帖发表评论!