Volver al radar
Inferencia/Serving
Ver en GitHub ggml-org/llama.cpp
Motor de inferencia de LLMs en C/C++ optimizado para CPU y GPU, permitiendo ejecutar modelos localmente con alto rendimiento.
★
114,690
Lang
C++
Motor de inferencia de LLMs en C/C++ optimizado para CPU y GPU, permitiendo ejecutar modelos localmente con alto rendimiento.