工联院大模型测评：国内头部大模型表现亮眼，整体与 GPT3.5 相当

据 36 氪 6 月 29 日报道，近期，中国工业互联网研究院针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。评测对象涵盖 GPT4、GPT3.5、文心一言、ChatGLM 等国内外大模型。结果显示，GPT4 表现最佳。国内头部大模型表现亮眼，整体与 GPT3.5 相当，其中百度文心一言表现超过 GPT3.5。