训练数据超 20 亿,云从科技视觉大模型刷新四项世界纪录
据36氪获悉,云从科技在视觉大模型上取得重要进展,其行人基础大模型在 PA-100 K、RAP V2、PETA、HICO-DET 四个数据集上从多家知名高校、企业与研究机构脱颖而出,刷新了世界纪录。其中最高在 PA100 K 上的 Fine-tuning 准确率达到 92.89%。据介绍,云从行人基础大模型,使用了超 20 亿的数据,包括大量无标签数据集以及图文多模态数据集,使模型能够提取到非常稳健的特征,轻松应用于多种行人任务。
据36氪获悉,云从科技在视觉大模型上取得重要进展,其行人基础大模型在 PA-100 K、RAP V2、PETA、HICO-DET 四个数据集上从多家知名高校、企业与研究机构脱颖而出,刷新了世界纪录。其中最高在 PA100 K 上的 Fine-tuning 准确率达到 92.89%。据介绍,云从行人基础大模型,使用了超 20 亿的数据,包括大量无标签数据集以及图文多模态数据集,使模型能够提取到非常稳健的特征,轻松应用于多种行人任务。