智谱 AI 与清华 KEG 发布并开源多模态大模型 CogVLM-17B

据 DoNews 10 月 12 日报道，智谱 AI 与清华 KEG 近日发布一种新的视觉语言基础模型 CogVLM。CogVLM 可以在不牺牲任何 NLP 任务性能的情况下，实现视觉语言特征的深度融合。智谱 AI 现已开源 CogVLM-17B，并提供了单台 3090 服务器即可运行的微调代码，以供大家研究和使用。据悉，CogVLM-17B 目前是多模态权威学术榜单上综合成绩第一的模型，在 14 个数据集上取得了 state-of-the-art 或者第二名的成绩。