全球十大AI训练芯片大盘点
NNP-T有270亿个16nm晶体管,硅片面积680平方毫米,60mmx60mm 2.5D封装,包含24个张量处理器组成的网格。 ![]() 核心频率最高可达1.1GHz,60MB片上存储器,4个8GB的HBM2-2000内存,它使用x16 PCIe 4接口,TDP为150~250W。 每个张量处理单元都有一个微控制器,用于指导是数学协处理器的运算,还可以通过定制的微控制器指令进行扩展。 NNP-T支持3大主流机器学习框架:TensorFlow、PyTorch、PaddlePaddle,还支持C++ 深度学习软件库、编译器nGraph。 在算力方面,芯片最高可以达到每秒119万亿次操作(119TOPS),但是英特尔并未透露是在INT8还是INT4上的算力。 作为对比,英伟达Tesla T4在INT8上算力为130TOPS,在INT4上为260TOPS。 拓展阅读: 英特尔首款AI芯片终于发布:训练推理两用,历时4年花费5亿美元买来4家公司 英伟达Volta架构芯片 英伟达Volta,2017年5月公布,从 Pascal 架构中引入了张量核、 HBM2和 NVLink 2.0。 ![]() 英伟达V100芯片就是基于此架构的首款GPU芯片,其核心数据为:
IO数据:
英伟达Turing架构芯片 Turing架构是对Volta架构的升级,于2018年9月发布,但 CUDA 和张量核更少。 ![]() 因此,它的尺寸更小,功率也更低。除了机器学习任务,它还被设计用来执行实时射线追踪。其核心数据为:
IO数据:
参考来源: https://www.jameswhanlon.com/new-chips-for-machine-intelligence.html 【编辑推荐】
点赞 0 (编辑:岳阳站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- 13个Python Web框架比较,你想使用哪个呢?
- 程序员报告:男性占比超87% 北京月薪12184元最高
- 前端小姐姐助你俘获女神心,双十一挑口红神器在此 | 开源项
- 科技赋能,践行普惠,2019中国数字普惠金融大会3月22日在京
- 微软工程师建议换掉 Chromium 代码库中的单词:黑名单和白名
- PyTorchTensorFlow跑分对决:哪个平台运行NLP模型推理更快
- ROG STRIX B365-F GAMING评测 售价最高的B360有何优点
- 被 Linus Torvalds 批评过的十一种技术
- 一篇文章带你了解kubernetes各组件间的通信机制
- 易观方舟V4.3发布 智能埋点治理、智能指标监控等亮点功能上