Volver al radar
Inferencia/Serving
Ver en GitHub mlc-ai/mlc-llm
Motor de despliegue universal para LLMs que usa compilación ML para optimizar y ejecutar modelos en múltiples plataformas (GPU, CPU, móvil).
★
22,835
Δ 7 días
+73
Lang
Python
Motor de despliegue universal para LLMs que usa compilación ML para optimizar y ejecutar modelos en múltiples plataformas (GPU, CPU, móvil).