Inferencia/Serving

mlc-ai/mlc-llm

Motor de despliegue universal para LLMs que usa compilación ML para optimizar y ejecutar modelos en múltiples plataformas (GPU, CPU, móvil).

★

22,835

Δ 7 días

+73

Lang

Python