Governo quer uma IA brasileira. Vamos conseguir?

Os modelos de IA atuais são treinados com dados majoritariamente em inglês

Os modelos de IA atuais são treinados com dados majoritariamente em inglês Imagem: Tetra Images/Getty Images

Quem utiliza o ChatGPT pode estar satisfeito com as respostas, mesmo quando conversa com a máquina em português. Ela parece entender o que escrevemos e produz resultados plausíveis, especialmente quando a máquina não alucina.

Mas a IA é como um gringo que fala bem português. Apesar de conseguir se expressar no nosso idioma, acaba processando a partir de sua língua nativa, o inglês. E isso tem implicações que precisam ser debatidas a partir de perspectivas técnicas, sociais e políticas.

Os modelos de IA atuais são treinados com uma quantidade absurda de dados majoritariamente em inglês. O modelo da Meta, por exemplo, foi treinado com aproximadamente 95% dos dados na língua inglesa e somente 5% dos dados restantes em outros idiomas.

    Clássico dos milhões vira clássico do Coutinho

    PVC

    Clássico dos milhões vira clássico do Coutinho

  • Palmeiras descansado não cansa de fazer gols

    Juca Kfouri

    Palmeiras descansado não cansa de fazer gols

  • Já se perguntou se você é... racista?

    Ana Cristina Rosa

    Já se perguntou se você é... racista?

  • Estamos viciados no fim do mundo

    Beatriz Mattiuzzo

    Estamos viciados no fim do mundo

Sempre que um modelo não sabe uma resposta de bate e pronto no idioma solicitado, ele tem o recurso de traduzir o que seria a resposta em inglês. E assim, respostas e histórias podem ser construídas a partir de uma visão específica de mundo. É como se a IA inaugurasse uma nova forma de soft power ao padronizar estilos linguísticos e ao dar sentido às coisas.

Mas esse lance não é o único problema. Tem também o desafio de hard power e soberania. A Inteligência Artificial é uma tecnologia de propósito geral que habilita o desenvolvimento de novas inovações de diferentes naturezas. Muitas aplicações do presente e do futuro ficarão dependentes desses grandes modelos de IA, por isso precisamos encontrar alternativas locais para não ficar totalmente dependente das big techs.

Nesta semana, estou em Cabo Verde como membro da delegação brasileira no "Fórum Lusófono da Governança da Internet", um evento que reúne os países falantes da língua portuguesa para discutir temas relacionados a internet e novas tecnologias.

O fórum reservou um dia inteiro para debates sobre os caminhos de IA, e eu fui um dos painelistas que teve como objetivo responder o porquê e como poderíamos conseguir mais representatividade do português nos modelos de IA.

A conclusão que chegamos após um diagnóstico crítico e muito debate é que, embora os países lusófonos não vão conseguir competir de imediato com as big techs, precisamos encontrar caminhos para promover tanto a criação de conjuntos de dados em português quanto o desenvolvimento de modelos.

Língua é poder, e ninguém melhor do que nós para cuidar dela.

Continua após a publicidade

Relacionadas

  • Nova fase: OpenAI lança IA com capacidade de raciocínio e aumenta os riscos
  • Supercomputador de Musk para treinar IA é 'game-over' para concorrentes?
  • Se não estivermos atentos, é assim que a IA pode arruinar a educação

Singapura fez algo parecido. Eles desenvolveram uma família de IA (chamada SEA-LION) que foi especificamente pré-treinada e ajustada às línguas da região do Sudeste Asiático. Os modelos não são tão robustos em tamanho como o ChatGPT, mas têm a vantagem de ser especializados em línguas específicas. Outro diferencial é ser de código aberto, o que incentiva o ecossistema de inovação local.

Entre os países lusófonos, o Brasil é o que está mais adiantado. O Plano Brasileiro de IA (PBIA) prevê uma ação específica para o desenvolvimento de uma IA nacional. No "Deu Tilt", podcast do de tecnologia e inovação, entrevistamos a Ministra de Ciência, Tecnologia e Inovação, responsável pelo documento, para entender melhor como funcionaria na prática a criação de uma IA brasileira.

Ela explicou que, apesar do montante de mais de 1 bilhão de reais reservado no plano, os detalhes seriam especificados por meio de um edital.

Sempre lembro que o diabo mora nos detalhes. E, nesse caso, mora mesmo.

Precisamos de muita atenção nos requisitos que serão escritos no edital porque o risco de jogar dinheiro pela janela não é pouco. São vários caminhos possíveis, como fomentar uma empresa "campeã nacional" que irá desenvolver um novo sistema de IA do zero ou diferentes organizações que poderão adaptar modelos de código aberto.

Continua após a publicidade

Newsletter

Um boletim com as novidades e lançamentos da semana e um papo sobre novas tecnologias. Toda sexta.

Quero receber

Possibilidades não faltam. Por isso, defendo que antes de definir esse edital, o governo reúna especialista para que possamos especificar bem o que queremos com a tal da IA brasileira.

Eu tenho uma opinião sobre isso que deixei claro na minha fala durante o fórum em Cabo Verde. Em vez de pensarmos a IA como um produto, precisamos pensá-la como um ecossistema. Quando falamos de uma IA brasileira, não podemos imaginá-la apenas como um chatbot que acessamos por meio de um site. É muito mais estratégico pensá-la como um ou mais modelos de código aberto que poderão promover um ambiente de inovação no Brasil e também nos demais países falantes da língua portuguesa.

Opinião

Texto em que o autor apresenta e defende suas ideias e opiniões, a partir da interpretação de fatos e dados.

** Este texto não reflete, necessariamente, a opinião do.

O que você está lendo é [Governo quer uma IA brasileira. Vamos conseguir?].Se você quiser saber mais detalhes, leia outros artigos deste site.

Wonderful comments

    Login You can publish only after logging in...