HiFloat8高效训推技术亮相AAAI大会

HiFloat8高效训推技术亮相AAAI大会

HiFloat低精度

作者:全球计算联盟GCC2026/01/26

1

2026 年 1 月 20 至 27 日,人工智能领域全球两大综合性顶会之一、由美国人工智能促进会(AAAI,Association for the Advancement of Artificial Intelligence)主办的第 40 届年度会议在新加坡举行。会上,华为 AI 处理器算法领域王鑫博士发表 HiF8 高效训推技术报告,向全球与会者介绍在模型训练和推理上进行 HiF8 量化的实践。HiF8 此前已由华为开放给全球计算联盟 GCC,并由 GCC 组织共建 HiFloat 生态。更多 HiF8 相关资讯欢迎持续关注 GCC 智算产发委。

AAAI 年度会议始于 1980 年,近年每届参会人数在 5000 到 8000 人,通常包括论文宣讲、特邀报告、Workshop、技术成果展示等议程。来自华为的 AI 处理器算法领域专家王鑫博士在 2026 年度大会期间发表了 HiF8 高效训推技术报告,并向与会者介绍模型训练和推理上进行 HiF8 量化的实践。

2

AI模型算法专家介绍HiFloat8高效训推技术实践

数据格式设计

3

HiFloat8数据格式示意

实践验证

在模型训练方面,使用 Current Scaling 策略时,HiF8 在粗粒度下(Per-tensor)可实现稳定且等效的训练性能;在 Delayed Scaling 策略下,HiF8 在大规模模型预训练中能够保持与高精度 BF16 相当的收敛性能、精度无损或近乎无损,并显著提升端到端训练效率。

在模型推理方面,大多数推理任务可以直接采用粗粒度的量化策略,对整个张量(Per-Tensor)进行缩放,甚至进行无缩放(Scale-Free)转换。消除了大量缩放因子的管理,从而大幅简化推理框架和硬件加速器的设计,也降低了内存带宽和计算开销,从而充分地发挥 8 位计算的加速潜力。

HiF8 此前已由华为开放给全球计算联盟 GCC,并由 GCC 组织共建 HiFloat 生态。GCC 智算产发委欢迎产业界伙伴一起,共同打造新一代低精度计算的全球产业高地。

联系我们

更多相关资讯可联系GCC智算产发委执行秘书长熊华获取。
邮箱:xionghua@gccorg.com

5