7 月 11 日,英特尔宣布正式面向中国市场推出第二代深度学习加速器——Habana Gaudi2,该产品可用于加速 AI 训练及推理,合作方名单上包括了浪潮信息、新华三、超聚变等中国的主要服务器厂商。
“在过去六个月,AI 加速芯片因为大模型的关系忽然又再火了一把,接下来我们会有更多的资源投入,利用本土团队让这些中国定制版的产品能够加速落地。”英特尔公司执行副总裁、数据中心与人工智能事业部总经理 Sandra Rivera 对第一财经表示,未来会在合法合规的情况下推出更多针对中国市场的定制产品。
Habana Gaudi 2 作为英特尔 AI 战略的关键产品之一,有望打破目前芯片市场的固有格局。
Habana Labs 成立于 2016 年,主要研发方向为人工智能、深度学习计算等,创业初期就得到了英特尔的投资,而后在 2019 年 12 月以 20 亿美元被其正式收购。
根据英特尔官方信息,Habana 的第二代加速器 Gaudi2 主要解决了大规模语言模型、生成式 AI 模型的强算力需求问题。从参数看,该芯片采用台积电 7nm 工艺制造,集成 24 个可编程的 Tenor 张量核心(TPC)、48MB SRAM 缓存、21 个 10 万兆内部互连以太网接口(ROCEv2 RDMA)、96GB HBM2E 高带宽内存(总带宽 2.4TB/s)、多媒体引擎等,支持 PCIe 4.0 x16,最高功耗 800W。
在性能上,根据机器学习与人工智能开放产业联盟 MLCommons 在六月底公布的 AI 性能基准测试 MLPerf Training 3.0 结果显示,Gaudi2 是除了英伟达产品外,唯一能把 MLPerf GPT 3.0 模型跑起来的芯片。
在发布会上,英特尔更是毫不避讳将产品与英伟达的同类产品进行比较,官方展出的 PPT 显示,Gaudi2 运行 ResNet-50 的每瓦性能约是英伟达 A100 的 2 倍,运行 1760 亿参数 BLOOMZ 模型的每瓦性能约达 A100 的 1.6 倍。
“英特尔正在降低人工智能的准入门槛,并强化客户在云端通过网络和智能边缘部署这一关键业务技术的能力,从而帮助构建中国人工智能的未来。”Sandra Rivera 表示,虽然是定制版本,但是在性能上没有打折,网速和国际版相比从 24 个网口变成 21 个网口,但整个性能还是基本一致的。
“在 4 月份的时候,看到了各种人工智能带来的芯片需求,包括 Gaudi 在内,需求至少翻了两倍以上。”Sandra 透露,英特尔在 2025 年将会把 Gaudi 的 AI 芯片跟 GPU 路线图合二为一,推出一个更整合的 GPU 产品,以构造可持续的软件生态。
伴随着大模型的火热,目前全球各大芯片公司都在积极进行 AI 芯片的布局。除了英伟达、英特尔等海外芯片厂商外,初创公司如 Wave Computing、Groq、寒武纪、比特大陆等也加入了竞争的行列,陆续推出了针对 AI 的芯片和硬件系统。
在此前举行的世界人工智能大会(WAIC)上,包括昆仑芯、登临、瀚博、天数智芯、燧原、墨芯、沐曦在内的芯片厂商也展示了各自 AI 芯片的能力。据不完全统计,目前与大模型“沾边”的 AI 芯片厂商已经超过三十家。
在业内人士看来,以 GPU、FPGA、ASIC 为代表的 AI 芯片是目前可规模商用 AI 芯片的主要阵地,这类芯片主要基于传统芯片架构,对某类特定算法或者场景进行 AI 计算加速。此外,还有偏向于前沿技术的类脑芯片、可重构通用 AI 芯片等,但距离大规模商用还有较长距离。
文章来源:http://www.codekj.com/html/news/xwdt/2023_07/13/3023940.html