Mistral Small 3: o modelo open source que rivaliza com GPT-4
Modelo de 22B parâmetros supera benchmarks do GPT-4 com fração do custo. Comunidade open source celebra.
A Mistral AI lançou o Mistral Small 3, um modelo de 22 bilhões de parâmetros que supera o GPT-4 em vários benchmarks de raciocínio e conhecimento. O número mais impressionante: roda em uma única GPU de 24GB de VRAM com quantização Q4, o que significa que um setup com RTX 4090 é suficiente.
O desempenho supera expectativas do tamanho. Em MMLU, HumanEval e Math, o Mistral Small 3 fica consistentemente acima do GPT-4 original, embora ainda abaixo dos modelos frontier atuais. Para a maioria dos casos de uso práticos — código, análise, escrita — a diferença é imperceptível.
Para rodar localmente: baixe o modelo via Ollama com `ollama pull mistral-small3`, ou use LM Studio para uma interface gráfica. O modelo está disponível em versões de 4-bit a 8-bit quantization. A versão Q4 usa cerca de 13GB de VRAM e oferece cerca de 30 tokens por segundo em hardware moderno.