Salvetat 初创公司正式发布Gaudi 2广度自学体能训练CPU

2022年5月10日,在AMDOn产业发展技术创新首脑会议(Intel Vision)上,AMD公司旗下的Habana Labs正式正式发布用作广度自学体能训练的第二代GaudiCPU——Gaudi 2,和即将上市的用作广度自学逻辑推理的GoyaCPU的后续产品——Greco。它们采用了7奈米晶片工艺技术以Habana的高节能构架为依据,面向互联网系统的计算机系统听觉和语义应用,意在为顾客的数学模型体能训练和逻辑推理提供更多更高的操控性。十大娱乐平台排行榜:

此次首脑会议上,Habana展现了Gaudi2在运转ResNet-50(v1.1)的计算机系统听觉和BERT Phase-1 和 Phase-2的语义处置工作时的体能训练操控性,几乎是英伟达 A100 80GBCPU的三倍。

Gaudi2:专为广度自学体能训练结构设计

对于互联网系统顾客而言,由于统计数据集和人工智慧销售业务的规模和复杂性不断增长,体能训练广度自学数学模型所需的时间和生产成本越来越高。Gaudi2意在为云和邻近地区顾客带来更高的广度自学操控性和工作效率,及更好的选择。

▲Habana Gaudi2 第二层卡

为提升数学模型的准确度和保密性,顾客需要更频密地进行体能训练。根据IDC的统计数据,在2020年接受调查的机器自学专业人士中,有74%的人对其数学模型进行过5-10次插值体能训练,超过50%需要每周或更频密地复建数学模型, 26%的人则每天甚至每小时会复建数学模型。56% 的受调查者认为培训生产成本是阻碍其组织利用人工智慧解决问题,技术创新和增强终端顾客体验的首要因素。如前所述此,第二代 Gaudi和Gaudi2其中的Gaudi平台软件系统不断涌现。

为广度自学而生,现已升级

如前所述与第二代Gaudi完全相同的体系构架,Habana Gaudi2CPU大幅提升了体能训练操控性。顾客在用户端运转Amazon EC2 DL1示例和邻近地区运转Supermicro Gaudi体能训练XDMCP,其高性价比比现有GPU软件系统提升了40%。

从第二代Gaudi到Gaudi2的构架进步包括以下这些:

?晶片工艺技术从16奈米跃居至7奈米;

?在行列式加法(MME)和TensorCPU核心理念计算发动机中引入了FP8其中的新正则表达式;

?TensorCPU的核心理念数量由8个减至24个;

?晶片上软件系统影音处置发动机,同时实现从主机模块的装载;

?MarchenoirPCB的二级缓存提升了3倍,从32GB提升到频宽2.45TB/秒的96GB HBM2E;

?三倍48MB的Core2SRAM内存;

?将如前所述 RDMA (RoCE2) 的软件系统调制解调器从10个减至24个,在标准互联网上同时实现高效的纵向和横向扩展。

专为AI而结构设计,提供更多200%的操控性

在评估广度自学的操控性和价值时,顾客期待现成的缩短体能训练时间并提升运营工作效率的体能训练方案。在AMDOn产业发展技术创新首脑会议(Intel Vision)期间,Habana全面展现了Gaudi2CPU与市场上其他领先软件系统较之的卓越操控性。如下表所示图象是与已正式发布的其他行业软件系统较之,常用的计算机系统听觉和语义处置数学模型的体能训练结论。

与处于完全相同晶片工艺技术结点的A100 GPU较之,Gaudi2的体能训练操控性明显高出约三倍。对比试验主要应用作如下表所示关键销售业务,同时也包括了与框架软件系统的全部软件。如下表所示试验结论表明,Gaudi2的专用广度自学加速构架具有更高的工作效率。

▲计算机系统听觉 – ResNet-50?

▲语义处置 – BERT结合Phase-1和Phase-2的有效吞吐量

▲语义CPU – BERT

工作阻抗和配置参见intel.com/performanceindex上的Vision部分。结论可能有所不同。

互联网容量、灵活性、工作效率

得益于每个Gaudi2CPU上软件系统的24个100GB RoCE调制解调器端口,体能训练时频宽大幅增加。

?纵向扩展:在每个Gaudi2CPU的端口中,有21个专用作8卡HLS-Gaudi 2服务器中的内部互联,同时实现全联接、非阻塞配置。

?横向扩展:在每个Gaudi2CPU有3个端口专门用作横向扩展,在8卡Gaudi服务器间提供更多2.4TB的互联网频宽。

?符合OCP的OAM标准:为了使顾客能够简化系统结构设计,Habana提供更多符合OCP规范的通用基板(UBB)。

?方便、灵活地使用:通过在片上软件系统标准的RoCE,顾客可以轻松地扩展和配置一个到数千个Gaudi2CPU,以满足自身的广度自学集群规模的要求。

?为系统建设提供更多更多选择:由于系统采用了广泛使用的标准调制解调器,Gaudi2能够让顾客可以灵活选择调制解调器交换机和相关互联网设备,进一步降低生产成本。

?软件系统工作效率:通过在晶片上软件系统互联网接口(NIC),能够大幅降低整体生产成本。

HLS-Gaudi2服务器

在软件系统8个Gaudi2卡的基础上,HLS-Gaudi2服务器亦包含一个双插槽AMD至强可扩展CPU模块。Habana不仅通过提供更多这款服务器让顾客更便于试验Gaudi2,同时也与系统OEM厂商合作,为终端顾客的部署提供更多相关软件系统。

▲Habana Gaudi2 的8结点集群

Gaudi2互联网系统领域进展

目前,位于以色列的Habana Gaudi2互联网系统已部署一千台HLS-Gaudi2服务器,不仅支持Gaudi2软件优化等研发工作,也为即将推出的Gaudi3CPU积累经验。

获取Habana Gaudi2软件系统

现阶段,Habana携手Supermicro计划在2022年第三季度推出Supermicro Gaudi 2体能训练服务器。同时,Habana亦与DDN联合打造采用Supermicro服务器和搭配DDN AI400X2存储的AI软件系统。

简化数学模型开发和迁移:满足开发者需求

为支持顾客将当前如前所述GPU的数学模型销售业务和系统迁移到Gaudi 2服务器,并帮助保护软件开发投入,Habana SynapseAI软件栈针对广度自学销售业务进行优化,意在简化数学模型的开发和迁移。SynapseAI软件系统了TensorFlow和PyTorch框架,并提供更多30多个流行的计算机系统听觉和语义参考数学模型,能够满足广度自学开发者的多样化需求。开发者可以在Habana开发者网站上获得文档和工具、操作指南和社区支持,并在Habana GitHub上获得参考数学模型和数学模型路线图。

上一篇:AMDOn产业发展技术创新首脑会议举行,正式宣布从云到边沿的崭新技术,化解目
下一篇:5月10日,漳州追加2例亚洲地区诊断,均在……