Evercreate
Back to radar
Inferencia/Serving

lightseekorg/tokenspeed

TokenSpeed es un motor de inferencia LLM de alto rendimiento optimizado para cargas de trabajo de agentes, ofreciendo un rendimiento comparable al de TensorRT-LLM con la facilidad de uso de vLLM.

View on GitHub
1,366
Lang
Python
1,3662026-06-042026-06-05