Evercreate
Volver al radar
Inferencia/Serving

vllm-project/vllm

vLLM es un motor de inferencia y serving de alto rendimiento para LLMs, destacado por su eficiencia en memoria y throughput.

Ver en GitHub
81,974
Lang
Python
81,9742026-06-042026-06-05