阿里云周靖人:全新开源大模型 Qwen-14B 提供更强大的认知等能力

据 36 氪 9 月 25 日报道,阿里云智能首席技术官周靖人在通义千问开源发布会上宣布,将全新开源性能更强的大模型 Qwen-14B,该模型基于 140 亿参数,3 万亿 token 训练的开源大模型提供更强大的推理、认知、规划和记忆能力。此外,相比之前的开源版本,新的 QWEN-7B(v1.1)模型能力普遍提升,核心指标最高提升 22.5%。

上一篇:

下一篇:

发表评论

登录后才能评论