阿里达摩院推大语言模型 PolyLM:通晓 18 种语言 拥有 1.7B 和 13B 两种参数版本
据站长之家消息,阿里巴巴达摩院发布的一个名为 POLYLM 的多语言大型语言模型引起了人们的兴趣。与其他多语言模型不同的是,PolyLM 能够在理解、推理和生成自然语言指令方面表现出显著的能力,该模型拥有 1.7B 和 13B 两种参数版本可选。人们提出了一个名为 MULTIALPACA 的数据集,它补充了现有的教学数据集,使大语言模型能够更好地遵循多语言教学,特别是非英语母语人士的教学。
据站长之家消息,阿里巴巴达摩院发布的一个名为 POLYLM 的多语言大型语言模型引起了人们的兴趣。与其他多语言模型不同的是,PolyLM 能够在理解、推理和生成自然语言指令方面表现出显著的能力,该模型拥有 1.7B 和 13B 两种参数版本可选。人们提出了一个名为 MULTIALPACA 的数据集,它补充了现有的教学数据集,使大语言模型能够更好地遵循多语言教学,特别是非英语母语人士的教学。