天垓 100 完成百亿级参数大模型训练
据 36 氪报道,6 月 10 日,在第五届智源大会 AI 系统分论坛上,上海天数智芯半导体有限公司对外宣布,在天垓 100 加速卡的算力集群,基于北京智源人工智能研究院 70 亿参数的 Aquila 语言基础模型,使用代码数据进行继续训练,稳定运行 19 天,模型收敛效果符合预期,证明天数智芯有支持百亿级参数大模型训练的能力。
据 36 氪报道,6 月 10 日,在第五届智源大会 AI 系统分论坛上,上海天数智芯半导体有限公司对外宣布,在天垓 100 加速卡的算力集群,基于北京智源人工智能研究院 70 亿参数的 Aquila 语言基础模型,使用代码数据进行继续训练,稳定运行 19 天,模型收敛效果符合预期,证明天数智芯有支持百亿级参数大模型训练的能力。