Inferencia/Serving

ggml-org/llama.cpp

Motor de inferencia de LLMs en C/C++ optimizado para CPU y GPU, permitiendo ejecutar modelos localmente con alto rendimiento.

★

114,690

Lang

C++