10 1 month ago

Open-weight Brazilian Portuguese LLM trained from scratch on 1.6B tokens. 87.8M params, Llama-style with GQA. Validation perplexity 21.34. Apache 2.0. Base model.

ea1d02dbce93 · 208B
Maracatu-80M e um modelo de linguagem brasileiro de 87.8M parametros (75.5M nao-embedding), treinado do zero em portugues brasileiro. Modelo BASE: completa texto em portugues, nao e assistente conversacional.