—在当今科技迅猛发展的时代,以芯片、板卡、服务器为主的人工智能基础设施(AI Infra)作为未来AI时代数字经济的基石,正逐渐从幕后走向台前,从数据中心走向每一个智能设备的边缘。随着 AI 技术的不断进步,全球对于 AI ...
结果在离开英伟达短短19个月后,他就率队交付一块国产全功能GPU苏堤。它采用先进的MUSA(MT Unified System Architecture)架构,集成AI计算加速、图形 ...
vLLM(Very Large Language Model)是一个高效的模型推理和服务框架。此次,摩尔线程成功将其MUSA(Massive Unified System Architecture)移植版本上线,为开发者在使用摩尔线程的全功能GPU时提供了实用的参考。这一创新的移植方案不仅涵盖了PagedAttention内存管理、连续批处理 ...