Evercreate
Back to radar
Inferencia/Serving

vllm-project/vllm

vLLM es un motor de inferencia y serving de alto rendimiento para LLMs, destacado por su eficiencia en memoria y throughput.

View on GitHub
81,974
Lang
Python
81,9742026-06-042026-06-05