昆仑万维：天工通用大模型推理能力超过 GPT-3.5 和 LLaMA2

据北京商报 9 月 17 日报道，昆仑万维发布消息称，在权威推理榜单 Benchmark GSM8K 测试中，昆仑万维自研的通用基座大模型天工大模型以 80% 的正确率脱颖而出，大幅领先 GPT-3.5（57.1%）和 LLaMA2-70 B（56.8%），“标志着天工大模型的推理能力达到全球领先，接近 GPT-4”。