Strix Halo (395)本地运行LLM测试

4条回复

在上一篇关于Mac Mini (M4 Pro)的文章里，我从几个方面较为全面地测试了M4 Pro运行LLM的现状。虽然大容量高位宽LPDDR统一内存的组合确实可以满足一些LLM场景的需求，但Apple GPU的一些弱点导致其相比市面上相同价位的方案较为尴尬。

本文我们的探讨对象是AMD的Strix Halo平台。它的参数与M4 Pro相似，那么它是否能避免Apple GPU的那些问题呢？正文开始之前先剧透结论：比M4 Pro少尴尬一些，但依然有点尴尬。

继续阅读 →

TSMC救不了Intel：酷睿Ultra 7 255H（Arrow Lake H45）测试

15条回复

几个月前，我曾有机会测试Intel专为超轻薄笔记本打造的Lunar Lake处理器。尽管其独特的设计让它脱颖而出，但在绝对性能方面的弱势意味着它可能并不适合大多数用户的主流PC需求。

对于主流笔记本产品线来说，Intel推出了Arrow Lake H45作为Meteor Lake的继承者。本次，我将对Arrow Lake H45中的酷睿Ultra 7型号（255H）进行测试。

声明：本文仅为个人测试，测试使用的一切设备、工具等资产与本人所在公司/职位无关，也没有接受任何赞助。

继续阅读 →

Apple统一内存适合运行LLM？理想很丰满，现实很骨感

24条回复

自从大语言模型开始流行以来，一直在AI领域深耕细作的NVIDIA直接获得了大量订单，导致产品供不应求，人们也一直在寻找更便宜的方案。这给了我们评估许多其它方案的机会，例如我前些时尝试搭建的W7900方案就是一个可行的替代。

碰巧的是，Apple刚好在LLM大火的时间点前后接连发布M1 / M2 Ultra，最大带来了128 / 192 GB且带宽高达800 GB/s的内存。考虑到本地运行LLM最大的瓶颈是显存容量和显存带宽，两者似乎是一拍即合，在数码媒体的渲染下创造了多个类似“Mac Studio > 6 * RTX 4090”的名场面。

事实真的是如此吗？经过实际测试，我发现尽管Apple Silicon可以将超大显存装进常规轻薄笔记本电脑，但在运行LLM方面存在各种妥协，使得苹果平台并没有比NVIDIA方案的性价比更高。

devil’s in the details

本文我们使用一组实测数据来介绍目前的现状。继续阅读 →

谈谈Linux与ITMT调度器与多簇处理器

10条回复

简单举例讲一下Linux的调度器是如何顾此失彼，以及一些硬件厂商的贡献者和维护者不在乎feature是否真的工作，造成用户困扰的。

继续阅读 →

David Huang's Blog

（真）日常与无情吐槽

Strix Halo (395)本地运行LLM测试

TSMC救不了Intel：酷睿Ultra 7 255H（Arrow Lake H45）测试

Apple统一内存适合运行LLM？理想很丰满，现实很骨感

谈谈Linux与ITMT调度器与多簇处理器