联想百应 AI 主机 300 体验:AI Max+395 芯片加持,能跑 120B 本地大模型
It之家2小时前

最近,NVIDIA 在 GTC Taipei 期间发布了 RTX Spark 超级芯片,引起业界的广泛关注,被认为标志着个人计算产业迎来了自图形加速时代以来最重大的变革。不过,在具体了解这款 RTX Spark 超级芯片之后,小编想到,这款芯片的思路,其实和 AMD 的“Strix Halo”锐龙 AI Max 300 系列处理器有着异曲同工之妙。而搭载 AMD 锐龙 AI Max+ 395 处理器的设备早在去年 1 月的 CES 大会上就已经发布,如今早已成为众多 AI 迷你工作站主机甚至是高端 AI 笔记本的“标配”选择。这两年,AI 已经成为不止科技圈,而是各行各业都重点关注的焦点,加上今年以来的“龙虾热”,AI 相关的产品与技术正迅速渗透到人们工作、生活的方方面面。不只是科技发烧友,就算是普通玩家,可能也有在本地部署专属自己的 AI 智能体的需求。刚好最近,IT之家收到了一台专业对口的桌面 AI 工作站,联想百应 AI 主机 300。今天我们不妨就对其进行一番体验,看看它在本地部署企业级 AI 智能体以及各方面性能上的表现究竟如何。一、外观设计联想百应 AI 主机 300 工作站在外观设计上走的是成熟、商务、极客的风格。机身整体以黑色为主基调,正面采用一块带有竖条纹理的悬浮式灰色面板,增加了视觉上的层次感。机身四周则被坚固耐用的金属材质所包裹,这种设计不仅提升了整机的抗跌落与防冲撞能力,也带来了更好的触感与品质感。左右两侧的进气孔采用赛博科幻风格的波点设计,为原本稍显单调的纯色主机增添了一丝灵动的点缀。在整机尺寸与体积控制方面,联想百应 AI 主机 300 作为一款桌面迷你 AI 工作站,其体积大约在 4.5 升左右。具体的长宽高尺寸分别为 190×97.5×249mm(IT之家测得为 202×120×258mm)。另外IT之家测得机身重量为 2.9kg,对于追求极致便携的传统迷你主机品类来说,这个体积和重量算不上十分苗条,放在背包里还是会有一定的坠重感。不过这是因为内部集成了一个高达 350W 的内置电源模块,所以能把体积缩减到这样已经是属于紧凑型的了。日常使用摆在桌面上也能做到简洁利落,可有效提升桌面的整洁度与美观度。作为一款桌面迷你 AI 工作站,联想百应 AI 主机 300 也提供了比较丰富的接口。在机身正面的前置 I/O 面板上,从下到上依次提供了一个 3.5 毫米的音频复合接口,两个传输速率达到 10Gbps 的 USB 3.2 Gen2 Type-A 接口,一个支持 40Gbps 数据传输与 DP 1.4 视频输出的 USB4 Type-C 全功能接口,以及一个对于摄影师和创作者极为友好的 SD 4.0 读卡器插槽。此外,正面还配备了带有白色 LED 指示灯的电源开关按键以及一个专用的性能模式切换按键,方便用户根据当前的工作负载随时调整主机的性能释放策略。转到机身背面的后置 I/O 面板,这里的接口阵容也很丰富。除了标准的 AC C13 电源输入接口外,还提供了一个额外的 3.5 毫米音频复合接口,一个支持 2.5G 速率的高速 RJ45 网络接口,一个 10Gbps 速率的 USB 3.2 Gen2 Type-A 接口,还有一个支持 40Gbps 速率与 DP 1.4 的 USB4 Type-C 接口。在视频输出方面,背面还单独配备了一个支持 HBR3(40Gbps)的 DP 1.4 接口以及一个支持 32Gbps FRL 的 HDMI 2.1 接口,最后还有两个日常用于连接键鼠等外设的 USB 2.0 规格的 Type-A 接口。整体看下来,联想百应 AI 主机 300 机身沉稳紧凑,金属材质搭配黑色机身有商务气质,机身的细节设计上又带点极客元素,是一款低调百搭的迷你 AI 主机。二、性能概述正如前文所说,联想百应 AI 主机 300 最大的看点自然是搭载了 AMD 旗舰芯片锐龙 AI Max+ 395。这款处理器采用全新的 Zen 5 架构,领先的 4nm 制程,16 核超大核心 32 线程设计,最高频率可达 5.1 GHz,并配备了 80MB 的缓存,整体规格非常强悍。同时它还集成了 Radeon 8060S 显卡。拥有 40 个 RDNA 3.5 架构计算单元。cTDP 范围在 45-120W 之间,可以平替 RTX 4070 独显,能在 1080p 分辨率下流畅运行各种游戏,还可驱动四台显示器,最高支持超高清 8K UHD,并能高效编码和解码多种视频 codec,如 AVC、HEVC、VP9 和 AV1。它的 NPU 采用了全新的 XDNA 2 架构,Al 算力 50 TOPS。根据官方材料介绍,其在 Windows 11 AI+PC 中,GPU 在 LM Studio 里的 Al 性能比台式机中的 NVIDIA GeForce RTX 4090 独显还要高出 2.2 倍,且功耗降低 87%。内存和存储方面。为了应对大参数 AI 模型对内存带宽和容量的严苛渴求,联想百应 AI 主机 300 板载了高达 128GB 容量的 LPDDR5x 超高频内存,通过统一内存架构和 AMD 可变显存技术,实现了 CPU、NPU 和集成显卡之间共享这 128GB 的海量内存空间,还可分配最高 96GB 给到显存,数据可以直接在芯片内部的高速总线上流转,实现了零拷贝的极致低延迟体验。凭借这套统一内存架构,这款主机的功耗得以再次降低 30% 以上,同时数据处理的延迟也被大幅缩短,AMD 锐龙 AI Max 系列处理器彻底打破了超大模型无法在本地流畅部署的技术壁垒。在存储系统上,该机标配了一块 2TB 容量的 PCIe 4.0 NVMe 高速固态硬盘。主板内部则提供了两个 M.2 2280 规格的插槽,均支持 PCIe 4.0 x4 通道。上手之后,IT之家也对联想百应 AI 主机 300 做了一系列的基准性能测试,好让大家整体了解这款迷你主机的硬核实力。首先是 CPU 的理论性能测试,在 Cinebench R23 的基准测试当中,联想百应 AI 主机 300 单核 2008pts,多核 36886pts 的表现,性能十分顶级。CineBench 2024 中,锐龙 AI Max+ 395 单核为 113 pts,多核为 1887 pts。GPU 方面,IT之家测了《3DMark》的 Time Spy 项目,得到显卡成绩为 12108 分,综合得分 11682 分。在 Fire Strike 项目中,Radeon 8060S 显卡成绩为 31792 分,综合得分达到 27723 分。然后是 Solar Bay 项目的测试,Radeon 8060S 显卡跑到 205.95 FPS,综合得分 54164 分。可以看到,无论 CPU 还是 GPU,锐龙 AI Max+ 395 处理器的基准性能都非常亮眼,足以和目前中高端的游戏本相抗衡。内存方面,通过 AIDA 64 的内存测试工具测得读取速度达到 119.94 GB/s,写入速度达到 211.98 GB/s,拷贝速度为 148.04 GB/s,时延为 141.8 ns。使用 CrystalDiskMark 测了 SSD 的读写性能,在 SEQ1M Q8T1 项目中,这块 SSD 的读取速度为 7010.44 MB/s,写入速度为 6303.56 MB/s。三、AI 功能体验我们知道,AMD 锐龙 AI Max+ 395 拥有为大模型量身打造的超强算力,这让以往不能在本地部署的超大模型都能在这台工作站中顺利运行,对于 AI 初学者、开发者乃至企业用户来说无疑会非常友好。所以接下来IT之家也将重点为大家体验使用联想百应 AI 主机 300 在本地部署各类 AI 模型、智能体以及相关的应用体验。1、OpenClaw 本地部署以及联想百应 Claw 体验首先,这款主机的核心卖点之一就是其本地优先的数据安全策略。所有的 AI 推理计算都可以在本地完成,敏感数据完全不需要上传到云端,这极大程度地满足了政企、医疗等行业对数据安全与合规性的要求。实测过程中,我们先来看一下用联想百应 AI 主机 300 本地“养龙虾”的体验。小编首先在本地部署了 OpenClaw,然后又在本地通过 Ollama 部署了 Qwen3.6 35B 的超大模型,让 OpenClaw 调用本地大模型。弄完了之后,小编给 OpenClaw 发了一个任务,让它帮我整理出当天全网科技圈热点最高的新闻 20 条,并整理成 Excel 表格,保存在电脑的“文档”文件夹里。可以看到,经过了大概 8 分钟后,OpenClaw 顺利完成了这个任务。不仅成功整理出了 20 条新闻热点,还按照热点程度分了等级,也根据要求将 Excel 保存在了指定的文件夹里。测试过程中,小编时不时打开 Windows 的性能管理器,32GB 的内存和 96GB 的显存占用都很高,任务过程都是在本地运行的。要知道,这可是高达 35B 参数的大模型本地运行,效果还是很出色的。为了降低用户的上手门槛,联想百应 AI 主机 300 内置了联想百应 AI 平台,支持一键部署私有知识库与 OpenClaw 企业级 AI 智能体。想要在这台主机上本地部署 OpenClaw 其实并不复杂。用户只需打开联想百应 App,点击立即部署选项,系统便会自动连接服务器下载所需的相关环境文件与依赖包。下载完成后,用户可以在直观的界面中选择适合的模型供应商,后续的默认模型可以根据实际需求灵活挑选。当然,如果你像小编一样已经在本地部署了 OpenClaw,也可以直接让联想百应来一键接管,整个过程只需要按照指引,两三步就能完成接管,非常简单。相较于直接在本地运行 OpenClaw,联想百应 Claw 中提供了很多可以一键实现或者简化操作的快捷功能。比如创建龙虾 Agent,你只需填写名称、身份描述、添加技能,即可快速创建。技能方面,联想百应 Claw 也内置了丰富的技能选项,都是一键即可添加,操作非常简单。这里小编直接创建一个运营专家的龙虾,根据操作指引,几步就可以完成创建。创建后可以在对话框左下角切换。不仅如此,你还可以将联想百应 Claw 快捷接入到钉钉、飞书、微信、企业微信、QQ 等平台,让它成为你办公或者生活的智能助手。这里我们以微信为例,接入的过程很简单,只需要根据操作指引扫码,两步就可以完成接入。接入后,微信上就会多出一个微信 ClawBot。小编直接在微信上对微信 ClawBot 发起任务,让它帮我设计一套针对某款手机的完整的小红书平台营销方案。在执行过程中,虽然是在微信上发起的任务,但由于接入的是刚才的联想百应 Claw,所以整个过程也是本地运行的,内存和显存的占用分别达到了 50% 和 70% 以上。在微信上看不到智能体执行任务的过程,大概 6 分钟后,运营专家龙虾智能体完成任务执行并返回了结果。可以看到,运营专家龙虾智能体对整个营销方案的设计还是十分完整全面的,而且具有相当的可操作性。同时让它生成的海报也交付了 3 张。而这一切,都是完全在本地完成的,得益于锐龙 AI Max+ 395 强大的基准性能统一内存架构和 AI 算力的支持,联想百应完全可以将养龙虾这件事放在终端测,这样对于一些隐私敏感型的任务,大家就可以放心交给龙虾去执行了。最后还需要提醒大家的是,如果你需要云端模型算力,也可以直接在联想百应上切换云端模型,同时购买联想的 Token Plan,配合本地的模型,就可以实现端云结合的养龙虾体验了。2、不同参数量本地大语言模型运行测试上面使用联想百应 AI 主机 300 本地跑龙虾的过程还是比较顺利的,并且都是调用本地的 Qwen3.6 35B 的超大模型。这也让我们好奇联想百应本地跑各种大语言模型参数时的实际吞吐性能到底怎么样。接下来,小编使用 LM Studio 来装载各种参数量的本地大语言模型进行测试。首先我们直接从 Qwen3.5 9B 参数的模型来测试,问它一个关于上海旅游攻略的问题,大模型很快完成了回答。回答的效果很不错,具体而详细。这次回答输出了 1271 tokens,速度为 33.03 tok/s,延迟为 0.17s。接着小编将模型切换到 Qwen 3.6 35B 模型,用类似的问题再进行测试。这次 Qwen 3.6 35B 模型的回答要比上一个更加详细,而且还提供了表格、各种需要避坑的要点也给列了出来。关键是,这次 35B 模型输出了 4752 个 tokens,输出速度为 61.66 tok/s,速度比刚才的 9B 模型更快了,可见大参数模型在更好的优化和量化技术下,也能获得更加出色的运行效率。为了进一步压榨它的潜力,我们直接上强度,尝试运行了参数量高达 120B 的 OpenAI 开源超大 GPT-OSS 模型。在加载该模型时,系统分配的 32GB 内存占用就已经飙到了 99%,但得益于锐龙 AI Max+ 395 的超大容量 256bit 四通道内存且高速的统一内存架构,机器还是能够顺利且稳定地将模型跑起来。测试时,小编还是用这个生成旅游攻略的问题来问它。GPT-OSS 模型的回答也很流畅和详细,可以看到它比较擅长使用表格,各种要点一目了然。可以看到,在运行 120B 的超大模型时,联想百应 AI 主机 300 依然能实现 38.67 tok/s 的生成速度,总计生成了 4260 个 tokens,延迟为 0.47s,这对于过去的个人 PC 或主机来说是很难想象的。3、本地大模型的创意内容生成体验除了文本类的大语言模型之外,我们也在本地实际部署并运行了目前在创作者圈子中比较流行的通用 AI 图像平台 ComfyUI,在里面搭建一个文生图工作流,做了本地文生图测试。测试时,小编使用的是 Zimage-Turbo -fp8 模型,让它生成一张亚洲男子在街头打电话的图片,提示词指令比较详细,图片分辨率是 1328×1328,迭代步数是 8 步。这张图片生成时间大概 1 分 10 秒,生成的图片品质还是非常高的,完全符合复杂的提示词指令的要求。测试时,小编给内存分配的是 96GB,显存是 32GB,可以看到在运行过程中内存和显存的占用都在 20% 左右,运行过程全程是断网的。接着小编将显存分配到 96GB,内存分配到 32GB,再运行一次,这次让它生成一个女子在河边散步的图片,提示词同样是比较详细和复杂的。而这一次图片生成的时间和上次差不多,都是 1 分钟 10 秒左右。这说明锐龙 AI Max+ 395 处理器的能力远不止此,我们甚至还可以适时加大 AI 工作负载,比如进一步提升图片分辨率,增加迭代步数,这样才更充分地利用内置显卡 Radeon 8060S 和统一内存架构的能力优势。生图过程中内存和显存占用最高到 80% 和 97%,但很快回落,对性能的开销不算很大。生成的图片质量也是非常高的,精致真实且充满细节。除了文生图,我们也测试了本地文生视频。在视频生成测试环节,小编使用的是 Amuse v3.5.2 这款软件,模型使用的是 LTX-2-Disstilled。测试时,小编先让它生成一段下雨天的街头,一个男人在打电话的视频。生成这段 6.7 秒的视频大概用了 11 分钟,一共 161 帧,视频分辨率 768×512,帧率为 24 fps,视频生成过程中,能看到对内存的占用比较高,96GB 的内存最高占用可以超过 75%,对显存的占用比较低,基本上都在 5% 以下。生成的视频如下:考虑到视频生成模型对算力和显存的恐怖榨取程度,这个速度表现无疑是比较出色的。总体看下来,这 128GB 的超大统一内存在面对诸如 120B 超大语言模型以及极为吃配置的 AI 文生视频任务时,与传统的消费级独显设备相比,联想百应 AI 主机 300 的架构优势与海量内存红利在此时就彻底显现出来了,面对超大参数的模型也不至于出现爆显存或心有余而力不足的尴尬局面。结语总体来说,这么一圈的测试体验看下来,联想百应 AI 主机 300 工作站的整体性能表现确实还是过硬的,主要是得益于 AMD 锐龙 AI Max+ 395 芯片超大的 128GB 内存容量和四通道 256bit LPDDR5x 内存位宽,通过统一内存架构设计,可以最高分配 96GB 给到显存,打破了以往桌面小主机无法胜任重度 AI 开发的刻板印象。海量的内存空间让它在本地部署各种百亿甚至千亿级别的大语言模型这件事上,有着目前市面上绝大多数常规产品无法比拟的巨大优势。再加上联想为其定制的联想百应,可以一键无脑部署 OpenClaw 企业级智能体,这对想零门槛体验和探索前沿 AI 应用的小伙伴来说,显然很是友好。而对于那些本身就具备开发能力的高阶玩家和极客而言,也可以顺手将其打造成纯本地的专属算力中心,从而跟高昂的云端算力账单和 API 调用额度说拜拜。从行业落地的视角来看,联想百应 AI 主机 300 在医疗、制造业以及更广泛的企业办公领域也都有可观的应用场景,比如在医疗行业,因为有些病人的数据是不能上云的,它就可以化身为本地的桌面影像智能诊断和病历录入的大脑,辅助医生进行快速决策,提升诊疗效率;在制造行业,通过异常数据 / 故障照片就能实时分析产线问题,实现预测性维护,减少停机损失;在企业进行私有智能体部署,也能自动生成周报、提炼会议重点、智能问答,化身全能 AI 助手;消费零售领域则更为常见,智能客服本地化,能实现对客户咨询的秒级响应,进而提升客户满意度。联想百应 AI 主机 300 作为一款强大的旗舰级主机,目前京东平台自营店面 128GB 内存 +2TB 固态的版本价格达到了 26999 元。它比较适合那些真正对本地 AI 有刚需、同时已经开始用 AI 干活,用 AI 真正能够提升工作和创作效率以及生活和办公体验感的用户,比如对本地数据隐私有着极高要求的企业用户、开发者与预算充足的极客们。京东联想百应 AI 主机 300 大模型台式电脑 mini 迷你主机 26999 元直达链接