Meta AI 推出多语言阅读理解数据集 Belebele

据品玩 9 月 4 日报道,Meta AI 近日宣布,推出一款名为 Belebele 的多语言阅读理解数据集,可以直接比较模型对不同语言的理解程度。

Belebele 其中涵盖了 122 种语言,可以评估高、中、低资源语言的单语言和多语言模型。该数据集由基于 FLORES-200 段落的精心设计的多项选择题和答案组成,能够以高资源和低资源语言评估 NLP 系统和大型语言模型。由于 Belebele 是完全并行的,因此可以直接比较所有语言的模型性能。

上一篇:

下一篇:

发表评论

登录后才能评论