Evercreate
Back to radar
Inferencia/Serving

ggml-org/llama.cpp

Motor de inferencia de LLMs en C/C++ optimizado para CPU y GPU, permitiendo ejecutar modelos localmente con alto rendimiento.

View on GitHub
114,690
Lang
C++
114,6902026-06-042026-06-05