apenas um lembrete gentil de que ninguém deve usar ollama > mais lento que llama.cpp no Windows > mais lento que mlx no Mac > wrapper inútil > ladrões de código literal alternativas? > lmstudio > llama.cpp > exllamav2/v3 > vllm > sglang > trt-llm literalmente qualquer coisa é melhor que ollama