GGUF
llama.cpp
Inference Endpoints