Entrar
Cadastro
Entrar
Publicidade
Publicidade
Receba notícias do Congresso em Foco:
Revolução digital
5/11/2025 13:03
Imagine um estudante de direito. Para se formar, ele precisa ler milhares de livros, artigos e decisões judiciais. Seu cérebro absorve tudo isso - conceitos, estilos de escrita, precedentes - e, com o tempo, ele desenvolve a capacidade de redigir suas próprias petições, contratos e pareceres. Ninguém diria que o estudante está "pirateando" os autores que estudou. Ele aprendeu com eles.
De repente, o que parecia óbvio vira a polêmica jurídica da década no campo digital. E é exatamente esse debate que está acontecendo no Brasil, com consequências que podem definir se seremos protagonistas ou apenas espectadores da revolução tecnológica mais importante do século XXI, catalisada pelo avanço da IA generativa.
O projeto de lei 2.338/2023 que tramita na Câmara dos Deputados após aprovação no Senado, tenta regular a inteligência artificial no Brasil. Entre seus pontos mais controversos estão os artigos 62 a 65, que tratam de direitos autorais. A intenção é nobre: proteger escritores, artistas e jornalistas. O problema é que, na prática, a proposta atual pode estar construindo uma muralha onde deveríamos ter uma ponte.
Os artigos propõem, entre outras coisas, que empresas de IA publiquem um "sumário" do conteúdo protegido usado no treinamento, que criadores possam proibir o "uso" de suas obras para esse fim e que haja remuneração obrigatória por esse uso, mesmo se o conteúdo estiver publicamente disponível.
A questão é que a proposta de lei parece querer regular a IA como se ela fosse um gigantesco repositório baseado em "copia e cola". Na realidade, o processo de treinamento de modelos de linguagem (motores da IA generativa) é, basicamente, matemático. Um texto é decomposto em "tokens" (pequenos pedaços), convertido em números (vetores) e usado para ajustar bilhões de conexões estatísticas na rede neural do modelo.
O objetivo não é armazenar qualquer frase, mas abstrair os padrões. É, literalmente, um processo de aprendizado, não de reprodução. Quando um chatbot "regurgita" um trecho de algo que fazia parte de seu treinamento, isso é tratado pela literatura técnica como overfitting - um problema a ser corrigido, e não a função pretendida.
Nenhum jurista sério defenderá que tecnologias possam ser usadas para contrafação (a pirataria). No entanto, o processo de aprendizado da IA passa longe dessa atividade. A atual redação do projeto de lei, uma das mais restritivas que se conhece no mundo, parece não compreender isso ao limitar a mineração de textos e dados, um dos passos essenciais para que a IA possa conhecer a sociedade e a ela ser útil.
Restringir a mineração automatizada de textos e dados (inclusive daqueles publicamente disponíveis) não é apenas operacionalmente difícil. É tecnicamente impossível em escala global e economicamente inviável, especialmente para empresas de tecnologia de matriz nacional.
Estudos sérios estimam que a IA pode adicionar até 13 pontos percentuais ao PIB brasileiro na próxima década. Setores como saúde (onde 62,5% das instituições já usam IA), agronegócio e educação dependem de modelos bem treinados, especialmente com dados de qualidade em português brasileiro (estima-se que somente 3% dos conteúdos na internet estejam em nosso idioma).
Além disso, o acesso a dados diversos e representativos é a receita para minimizar um dos principais riscos da IA: o viés algorítmico indesejado. Ao restringir o treinamento, o projeto de lei 2.338/2023 se torna, paradoxalmente, uma pedra no sapato para o campo da IA responsável no Brasil.
Mas ainda há tempo de agir. A Câmara dos Deputados tem a oportunidade ímpar de ajustar o texto. A própria redação atual revela suas distorções: embora o artigo 63 reconheça a importância da mineração de dados para "pesquisa e desenvolvimento", ele restringe essa possibilidade apenas a instituições "científicas, de pesquisa e educacionais, museus, arquivos públicos e bibliotecas" que não tenham fins lucrativos. Na prática, isso afasta toda a iniciativa privada, que hoje tem participação essencial em todos esses campos.
A regra, da forma como está projetada, não se harmoniza com a própria função social dos direitos autorais. Esses direitos, fundamentais e irrefutáveis, existem para proteger a dignidade de quem cria, garantindo que, no final, existam novas criações que beneficiem toda a sociedade. Eles não se prestam a restringir a geração de conhecimento e admitir isso seria contrariar o próprio sentido de existir dos direitos autorais.
Voltando à nossa analogia: a atual versão da proposta legislativa equivale a dizer que o estudante de direito só pode aprender com os livros se seu estágio for, por exemplo, na biblioteca pública. Se ele for para um escritório de advocacia privado, o exato mesmo ato de aprender com aqueles mesmos livros torna-se, de alguma forma, ilícito. Ao limitar a mineração de dados a certas entidades, o PL basicamente determina que o aprendizado será um privilégio para uns e um ilícito para outros.
Se queremos que a IA no Brasil seja justa, inclusiva e eficaz, precisamos permitir que ela aprenda com a riqueza da nossa cultura. Não podemos, por medo ou incompreensão, proibir o aprendizado e condenar o Brasil à irrelevância digital.
O texto acima expressa a visão de quem o assina, não necessariamente do Congresso em Foco. Se você quer publicar algo sobre o mesmo tema, mas com um diferente ponto de vista, envie sua sugestão de texto para [email protected].
Temas