O Serviço Federal de Processamento de Dados (Serpro) anunciou um movimento estratégico para cortar a dependência de modelos de linguagem estrangeiros (LLMs) e fortalecer a soberania tecnológica do Brasil no campo da inteligência artificial. A iniciativa envolve a criação de um modelo nacional em português, treinado com dados gerados no país, hospedado integralmente na infraestrutura da estatal.
Segundo Carlos Rodrigo Fonseca Lima, gerente do Centro de Excelência em Ciência de Dados e IA do Serpro, o objetivo é evoluir a partir de modelos open source já operando internamente, garantindo que nenhum dado seja enviado para fora. “O próximo passo é construir um novo modelo com dados brasileiros, assegurando soberania operacional, tecnológica e cultural”, afirmou o executivo.
O projeto prevê uma consulta pública para selecionar o parceiro privado que participará do desenvolvimento do modelo, com exigência mínima de 10 bilhões de parâmetros e suporte multimodal — capaz de processar textos e imagens. A meta é estabelecer uma base nacional capaz de manter o governo atualizado em IA sem depender de atualizações de provedores estrangeiros.
A arquitetura da iniciativa envolve a plataforma denominada “Plataforma de IA Generativa”, que integra modelos de linguagem (como Mistral, GEMA, DeepSeek e Gaia, este último brasileiro), APIs de IA, agentes automatizados e aceleradores de negócio. No topo, encontra-se o Conversai Studio, um assistente treinado com bases de conhecimento de órgãos públicos e hospedado nos data centers do Serpro.
O Conversai Studio é apresentado como um “ChatGPT para o governo”, permitindo que cada órgão interaja com suas normas e dados de forma segura, sem tráfego de informações para fora da infraestrutura estatal. Atualmente, o Serpro atende mais de 700 clientes com soluções de IA, incluindo o DataValid, utilizado por bancos e plataformas digitais para validação biométrica, além de sistemas customizados para órgãos públicos.
No campo da IA generativa, já há aplicações em teste em instituições como Receita Federal, PGFN e IBGE, com foco em análise de dados e automação de fluxos administrativos. De acordo com o cientista de dados Marcelo Pita, a expansão dessas operações exigirá a duplicação da capacidade dos data centers de Brasília e São Paulo nos próximos cinco anos, acompanhando o crescimento da demanda por IA e das reformas tributárias.