开篇
Deepseek本地化部署在这个月已经被玩疯了,“个人AI实验室”、“Deepseek接入本地知识库”、“利用Deepseek训练私人AI助手”,相信很多用户都开始着手甚至已经都打造完毕了,虽然蒸馏版和量化模型对于满血原版在使用体验上还是存在差异,但本地化运行合适的模型对于可以满足应用的朋友来说绝对是非常值得的事情,本地部署将模型和数据完全存储在用户设备中,避免了云端服务可能存在的隐私泄露风险。例如,DeepSeek的蒸馏版模型通过Ollama部署时,所有交互数据仅在本地处理,无需上传至第三方服务器,无需依赖网络连接即可运行,用户可在无网环境下(如偏远地区、飞行模式)随时调用模型,提升响应效率。本地部署AI大模型的核心硬件瓶颈不仅在于GPU和内存,硬盘的容量与性能同样至关重要,若需同时部署多个模型(如Qwen1.5 72B、Llama3 70B等),单个模型文件可达数十GB,硬盘容量需扩展至512GB甚至1TB以上。
好了到这里,大家可以打开一下电脑看下SSD剩余容量,开始折腾本地部署Deepseek的时候我也是瞧不起这20GB的容量,但到了后来随着下的模型增加了,LMStudio和Ollama双修,加起来模型100GB以上,这还不包括前面提到的72B的模型,后面又折腾Docker下的知识库,不小心这些就拿了我超过200GB的硬盘空间,硬盘告急,于是就有了这次金士顿KC3000 PCIe 4.0 NVMe M.2 SSD的由来,一步到位,解决Steam和本地部署模型的空间焦虑。
金士顿KC3000 4TB M.2 PCIe SSD 包装
金士顿KC3000 4TB M.2 PCIe SSD 包装
参数规格
金士顿KC3000从512GB到4096GB总共4种容量型号,全系采用群联Phison E18旗舰级主控,读写最高可达7GB/s和7GB/s,4K随机读写同时突破百万大关,其中本文的这款型号就是KC3000 4096GB,容量更是达到了3.2PB ,对于桌面级的SSD来说这样的寿命相当耐久了,我顺便统计了一下目前京东平台消费级M.2 SSD的写入寿命,KC3000系列几乎是最高的。同时4TB容量型号板载了4GB DDR4-2666 的缓存颗粒,无论是做系统盘还是仓库盘都是非常好的选择,性能和容量兼顾。
整体
金士顿KC3000 PCIe 4.0 NVMe M.2 4TB SSD
整体
4TB容量型号必然是双面颗粒,尺寸规格还是标准的M.2 2280可以兼容目前主板以及笔记本存储扩展,当然如果要发挥出其最高读写性能,请务必搭配PCIe 4.0 x4总线的M.2插槽。正面半高式石墨烯铝制散热片很薄,覆盖了整个正面的主控,缓存以及闪存颗粒,对于重度存储写入的用户,推荐采用安装有M.2散热盔甲的主板。
取下背面铭牌
取下正面导热铝片
正反面总共8颗3D TLC NAND颗粒
我手里的这款固态颗粒采用镁光176层NAND技术,同比读写延迟缩短25%以上,更紧凑的NAND设计结构,金士顿测试封装。
群联PS5018-E18主控
群联E18系列旗舰级主控,采用最新的12nm工艺,3+2核心处理器,支持最新的NVMe 1.4协议,持续读写速度均突破7000MB/s,温度控制也很好。
主板上正反各两颗DDR4-3200 低功耗缓存颗粒 总共4GB
基准
测试硬件平台为i7-14700K+Z790 Hero主板,M.2接口采用PCH提供的M2_2插槽,位置是靠近IO挡板位于PCIe Slot 2与Slot 3之间的部分,主板自带的M.2散热片。
Kingston SSD Manager界面 可以更新SSD固件与了解SSD当前健康状态
ASSSD
ASSSD Copy
CDM 1GB样本测试
CDM 32GB样本测试
3dmark storage跑分
我们通过LM Studio和Ollama两个平台进行了部署,这里的建议就是如果你不需要联网,那么LM Studio更友好,并且可以配合AnythingLLM实现本地知识库, 简单易上手,如果部署后供多人建立本地知识库就更推荐Ollama+Page Assist+RAG Flow的组合,但后者相对部署更麻烦一点,win环境下需要通过WSL安装Doker来实现。
本地部署量力而行 个人玩家单卡的话推荐14B和32B的蒸馏模型
这里我们分别以两个平台为例进行简单测试,部署的模型为DeepSeek-14B的Qwen蒸馏模型,量化程度为Q4,模型文件和模型框架全部丢在KC3000 4TB SSD上,同时对比全部丢在4TB机械硬盘的情况(Win系统不在机械硬盘)。
能看到还是模型框架平台如果也在不同的硬盘上多少还是会带来一定的差异,尽管模型是Loading到内存,但对于通过Doker环境挂载知识库的情况很容易出现本地内存不足,特别是设置CPU负载占比较高的时候,需要调用硬盘的虚拟内存来作为缓存,此时平台的存储载体如果性能差异较大还是会带来输出令牌效率的差距,这个差距如果量化到GPU上来弥补,那可能成本就要远超过一张SSD的价格了。另外,在AI模型加载的时候也会有很明显的速度区别,对于频繁需要切换AI模型的用户来说SSD绝对是标配。
金士顿KC3000 PCIe 4.0 NVMe M.2 SSD属于一款各项规格都很均衡的PCIe 4.0 x4规格的SSD,性能和温度表现都不错,而且写入寿命也非常可观。不单纯是作为仓库盘,作为系统盘来说也会有不错的性能,这次折腾Deepseek本地部署看似模型文件只有几十个G,但玩起来就不知用这几个模型了,而且加上数据集,临时文件和依赖库等等这个容量需求会被进一步扩大,再加上如果要用到Docker的话就更是会进一步吃硬盘的容量,2TB已经普及,4TB容量也不再是触不可及了,无论是游戏还是折腾AI模型本地部署,都不会让你因为存储而产生焦虑了。
|