微软近日宣布,已将WebGPU技术整合至ONNX Runtime Web中,此举预示着复杂机器学习模型在网络浏览器中的运行性能有望大幅提升。目前,Chrome和Edge浏览器已初步支持这一尚处于早期阶段的技术。
ONNX Runtime Web是微软推出的Javascript库,专为网络开发人员设计,可直接在浏览器环境中部署并加速机器学习模型。而新融入的WebGPU作为一种新型网络API,能够有效利用硬件加速功能,显著提高模型在网络环境下的运行效率。在此之前,由于浏览器计算能力局限,大型及复杂生成模型在网络浏览器上运行效能受限,但WebGPU的到来或将改变这一现状,它能充分利用GPU潜能,助力这些模型高效运行于浏览器内。
微软透露,WebGPU凭借先进的计算着色器等特性,能够高效处理复杂的机器学习任务,并通过支持半精度(FP16),有效降低了GPU内存占用与带宽需求,进一步加快运算速度。当前,包括Mac、Windows、ChromeOS平台上的Chrome 113和Edge 113版本,以及Android平台上的Chrome 121版本,默认集成了WebGPU支持。这意味着开发者们可以开始尝试结合ONNX Runtime Web调用WebGPU资源,提升其机器学习模型在浏览器中的运行表现。随着WebGPU技术的持续演进和完善,未来我们有望看到更多高效便捷的机器学习应用在网络浏览器中大放异彩。