智谱 AI 与清华 KEG 发布并开源多模态大模型 CogVLM-17B
据 DoNews 10 月 12 日报道,智谱 AI 与清华 KEG 近日发布一种新的视觉语言基础模型 CogVLM。CogVLM 可以在不牺牲任何 NLP 任务性能的情况下,实现视觉语言特征的深度融合。智谱 AI 现已开源 CogVLM-17B,并提供了单台 3090 服务器即可运行的微调代码,以供大家研究和使用。据悉,CogVLM-17B 目前是多模态权威学术榜单上综合成绩第一的模型,在 14 个数据集上取得了 state-of-the-art 或者第二名的成绩。