标签归档：LLM

Strix Halo (395)本地运行LLM测试

在上一篇关于Mac Mini (M4 Pro)的文章里，我从几个方面较为全面地测试了M4 Pro运行LLM的现状。虽然大容量高位宽LPDDR统一内存的组合确实可以满足一些LLM场景的需求，但Apple GPU的一些弱点导致其相比市面上相同价位的方案较为尴尬。

本文我们的探讨对象是AMD的Strix Halo平台。它的参数与M4 Pro相似，那么它是否能避免Apple GPU的那些问题呢？正文开始之前先剧透结论：比M4 Pro少尴尬一些，但依然有点尴尬。

继续阅读 →

Apple统一内存适合运行LLM？理想很丰满，现实很骨感

24条回复

自从大语言模型开始流行以来，一直在AI领域深耕细作的NVIDIA直接获得了大量订单，导致产品供不应求，人们也一直在寻找更便宜的方案。这给了我们评估许多其它方案的机会，例如我前些时尝试搭建的W7900方案就是一个可行的替代。

碰巧的是，Apple刚好在LLM大火的时间点前后接连发布M1 / M2 Ultra，最大带来了128 / 192 GB且带宽高达800 GB/s的内存。考虑到本地运行LLM最大的瓶颈是显存容量和显存带宽，两者似乎是一拍即合，在数码媒体的渲染下创造了多个类似“Mac Studio > 6 * RTX 4090”的名场面。

事实真的是如此吗？经过实际测试，我发现尽管Apple Silicon可以将超大显存装进常规轻薄笔记本电脑，但在运行LLM方面存在各种妥协，使得苹果平台并没有比NVIDIA方案的性价比更高。

devil’s in the details

本文我们使用一组实测数据来介绍目前的现状。继续阅读 →

(水) 2x W7900 Dual Slot 的 LLM 初步体验

4条回复

早些时还在装7970X TR机器的时候我就在物色各种大显存显卡想拿来本地跑70B LLM，奈何一直没有合适又便宜的解决方案：正经的A/N计算卡或者48G VRAM的NVIDIA GPU太贵，闲鱼上便宜的数据中心拆机卡（L20等）需要折腾散热，原版W7900又是三槽卡，跟我机箱主板合不来。

相比之下新发布的W7900DS不仅可以完美适应我的需求，甚至官方标价比原版W7900还便宜500刀。因此发布后不久我就找AMD的熟人问了一些门路，在国内到货的第一时间买到了这两张售价相对比较便宜的黑色高级显卡。

继续阅读 →

David Huang's Blog

（真）日常与无情吐槽

标签归档：LLM

Strix Halo (395)本地运行LLM测试

Apple统一内存适合运行LLM？理想很丰满，现实很骨感

(水) 2x W7900 Dual Slot 的 LLM 初步体验