英伟达中国区首席技术官:将任务负载从 CPU 移至 GPU,整体能耗将节省更多
据澎湃新闻报道,7 月 7 日,在 2023 世界人工智能大会上,英伟达(NVIDIA)中国区首席技术官赖俊杰表示,英伟达在全球数据中心计算问题上观察到两个重要趋势:一是人们对人机交互的期望大大提高,引发了全球第二波关于大模型的投入浪潮。二是很多互联网公司面临着用户需求增长、功耗越来越多的问题,特别是人工智能的大模型访问比例增加,意味着需要更多的能耗投入。
针对第二个趋势,英伟达提出如果能更多地将任务负载从 CPU 移至 GPU,那么能在支撑同样多的用户请求的同时,节省更多的能耗。