英伟达推748GB显存桌面站:本地跑大模型,两月回本
英伟达正式推出 DGX Station,这款专为 enterprise 级应用设计的桌面设备,正试图以强大的本地算力取代企业对云端 AI 订阅服务的依赖。其核心突破在于配备了748GB 统一内存,并搭载最新的GB300 Grace Blackwell Ultra 芯片,实现了从云端到本地的算力迁移。
打破内存瓶颈,本地驾驭千亿参数
DGX Station 的性能基石是 GB300 Grace Blackwell Ultra 芯片,该芯片创新性地将 72 核 ARM CPU 与 Blackwell Ultra GPU 集成,并通过 748GB 统一相干内存消除了传统架构中 CPU 与 GPU 间的数据传输延迟。这种架构使得系统能够在不牺牲精度的情况下,于本地无缝运行参数高达700 亿的大型 AI 模型。
对于更复杂的场景,该系统支持先进的模型量化技术,能够处理参数量达一万亿的超大模型。这不仅提升了处理高负荷工作负载的效率,更为重视数据隐私的行业(如医疗、金融、国防)提供了对敏感数据的完全控制权,避免了云端部署潜在的安全风险。
高昂售价背后的快速回报
DGX Station 的定价区间为9 万美元至 10 万美元,明确指向企业团队而非个人用户。尽管前期投入较高,但其成本效益显著。据测算,对于拥有大量 AI 工作负载的企业,相较于持续支付昂贵的云 GPU 服务费用,DGX Station 的投资回报期(ROI)最快可在两个月内实现。
该设备主要服务于三类需求:需要私有化基础设施以保护敏感数据的组织、处理高性能计算密集型任务的团队,以及寻求降低长期云服务成本的企业。对于预算有限或需求较轻的用户,英伟达提供了售价 4,000 美元的 DGX Spark 作为替代方案,而苹果 Mac Studio 则构成了另一层面的竞争选择。
未来路线图:向下兼容与生态扩张
英伟达并未止步于此,其未来愿景旨在扩大 AI 硬件的可访问性。公司计划于2026 年第四季度推出兼容 Windows 版本的 DGX Station,通过 Windows 子系统(WSL)吸引更广泛的开发者群体。此外,面向消费级市场和小规模用户的RTX Spark芯片也在开发中,旨在让高性能 AI 能力渗透至台式机和笔记本电脑端。
随着 DGX Station 的落地,英伟达正重新定义本地 AI 计算的边界。通过提供兼具隐私安全、高性能与成本优势的解决方案,英伟达有望引领下一波本地 AI 技术革新,帮助企业在摆脱云依赖的同时,最大化 AI 运营的效率与控制力。
【星途科讯 图文丨伊贝 首发于 ZAKER 科技,转载请注明出处】
