[返回数码家电首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
770亿晶体管的中国第一算力通用GPU芯片!壁仞科技BR100亮相海外
送交者: 婉君[★★★★不服⭐来赌★★★★] 于 2022-08-23 14:00 已读 4828 次 2 赞  

婉君的个人频道

8月9日,国内科技创新企业壁仞科技(Birentech)正式发布了BR100系列通用计算GPU,号称算力国内第一,多向指标媲美甚至超越国际旗舰产品。

当地时间8月22日,第34届Hot Chips芯片大会首日演讲,NVIDIA Hopper、AMD Instinct MI200、Intel Ponte Vecchio三大巨头的通用GPU纷纷秀出肌肉,而与之并肩亮相的,就是壁仞科技BR100。

会上,壁仞科技联合创始人、CTO洪洲与壁仞科技联合创始人、总裁徐凌杰进行了题为“Biren BR100 GPGPU: Accelerating Datacenter Scale AI Computing”的主题演讲,为来自全球的专业听众介绍了BR100芯片的特点与原创芯片架构的细节。

根据介绍,作为主要用于加速数据中心规模通用计算的GPGPU芯片,BR100具有极高的算力密度,单卡16位浮点算力达到PFLOPS级别,并具备高速片上与片外互连带宽。

BR100采用7nm制程工艺、Chiplet小芯片设计和CoWoS 2.5D封装技术,以OAM模组形态部署,能够在通用UBB主板上形成8卡点对点全互连拓扑。

为了支持强大的算力,BR100配备了超过300MB的片上高速缓存,用于数据的暂存和重用,以及64GB的HBM2E高速内存。

它的核心计算单元由大量通用流式处理器组成,具备通用计算和2.5D GEMM架构的专用张量加速算力。

在原创架构层面,壁仞科技按照深度学习等通用负载的计算特点,提供一系列针对数据流的增强特性,包括特殊的C-Warp协同并发模式、张量数据存取加速器TDA、NUMA/UMA访存模式、近存储计算等。这些特性是BR100能够在算力和能效比上达到全球领先水准的关键。

此外,壁仞科技还介绍了一种新的TF32+数据类型,具备比TF32数据类型更高的精度。

在软件方面,壁仞科技还介绍了BIRENSUPATM软件栈,其核心编程模型具有C/C++编程接口和运行时API,风格与主流的GPGPU开发语言和编程范式类似。

它能够使开发者在BR100上非常容易地进行编程开发,同时大幅降低代码迁移工作量,实现从主流编程环境向BIRENSUPA平台的无缝迁移。

资料显示,壁仞科技BR100集成了多达770亿晶体管,规模上堪比人类大脑神经细胞,已经非常接近800亿个晶体管的NVIDIA GH100计算核心,而且BR100系列芯片一次就点亮成功了!

性能方面,INT8整数计算2048 Tops(每秒2048万亿次)、BF16浮点计算1024 TFlops(每秒1024万亿次)、TF32+浮点计算512 TFlops(每秒512万亿次)、FP32双精度浮点256 TFlops(每秒256万亿次)。

此外,它的外部IO带宽达2.3TB/s,支持64路编码、512路解码,还支持PCIe 5.0、CXL互连协议。

评分完成:已经给 婉君 加上 50 银元!

喜欢婉君朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ 婉君的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回数码家电首页]
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名:密码:[--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助

手机扫描进入,浏览分享更畅快!

楼主本栏目热帖推荐:

>>>>查看更多楼主社区动态...





[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]