O Serpro anunciou a abertura de uma chamada pública para buscar um parceiro com o objetivo de criar uma IA generativa em língua portuguesa. O foco é treinar e operar grandes modelos de linguagem (LLMs) com dados nacionais sob gestão do governo brasileiro.
Segundo dirigentes da área de inteligência artificial, a capacidade de treinar LLMs com bases novas representa um diferencial competitivo de alcance internacional. O time destaca que o desenvolvimento já ocorre na estatal e que a tecnologia está integrada a vários produtos, inclusive além do setor público.
A plataforma atual faz uso de modelos open source disponíveis em ambientes como TensorFlow, mantendo parcerias com grandes empresas globais de tecnologia. Entre os modelos já em operação estão Mistral, Gemma 3 (Google), Deepseek, Llama (Meta), Qwen (Alibaba), GPT OSS (OpenAI) e Gaia, versão brasileira desenvolvida pela Universidade Federal de Goiás a partir do Gemma, adaptada ao português brasileiro.
Todos esses sistemas rodam on premises, ou seja, dentro dos data centers do Serpro. Segundo o superintendente Welsinner Brito, é um “primeiro passo de soberania” porque os dados e os modelos ficam no território brasileiro e sob controle da própria estatal.
O edital também aponta que a parceria deverá buscar soberania técnica e cultural, com foco em LLMs em português do Brasil e governança de dados para garantir critérios de seleção e qualidade no treinamento. Além disso, a equipe ressalta a necessidade de reduzir vieses e manter a qualidade das respostas, com estratégias como fine-tuning e continuous training para aprimorar o desempenho e refletir a cultura brasileira.