O crescimento comercial explosivo da IA intensifica a atuação dos monopólios de tecnologia (Big Techs) sob a lógica imperialista, mas a propaganda neoliberal tenta esconder o papel da exploração do trabalho no desenvolvimento desse campo. É necessário entender essa dinâmica a partir do método marxista-leninista para propor alternativas de luta.
Lucas Carvalho | Núcleo Internacional da Unidade Popular
INTERNACIONAL – Junto com o avanço das tecnologias digitais cresceu e se espalhou exponencialmente a utilização de métodos chamados de “inteligência artificial” (IA, ou AI em inglês). Diferente dos programas de computador clássicos que precisam de regras bem definidas por trabalhadores, a IA permite que um programa se adapte (“aprenda”) a partir de exemplos (comumente chamados de dados), com menos auxílio do trabalhador humano.
Embora seu uso e as técnicas em si não sejam tão recentes, sua popularidade explodiu nos últimos anos devido aos resultados impressionantes que começaram a apresentar, particularmente nos campos de reconhecimento e geração de imagens, bem como no de processamento de texto. Os avanços da inteligência artificial, e o seu papel na sociedade como um todo, são noticiados e analisados pelo discurso hegemônico sob uma ótica muito influenciada pela ideologia do imperialismo estadunidense: o mito do empreendedor do vale do silício, que dialeticamente produz e foi produzido pelo braço ideológico do Neoliberalismo. Sob a lente dessa ideologia são exaltados os papéis de aspectos abstratos e difusos, como ideias inovadoras e espírito empreendedor, escondendo o trabalho e dinâmicas materiais que sustentam a indústria das tecnologias digitais.
Superexploração do trabalho de rotulação de dados
Não é possível desenvolver uma IA sem uma grande quantidade de dados, por isso um aspecto muito importante no desenvolvimento histórico dessas tecnologias é o fato de que apenas foram possibilitadas por causa da popularização da internet. Toda vez que interagimos com a internet – seja pelas redes sociais, jogando algum jogo no celular etc. – nosso comportamento, onde clicamos, o que escrevemos está sendo coletado e armazenado na forma de dados.
Mas não basta apenas ter um grande volume de informação armazenado, ele precisa ser catalogado e organizado, um trabalho que ainda é necessário um grande esforço humano. Em 2007, foi criado por pesquisadores de IA o conjunto de dados ImageNet2 através de 14 milhões de imagens que eles baixaram da internet com buscadores como o Google. O objetivo era ter um conjunto de imagens para “ensinar” inteligências artificiais a identificar qual objeto está em uma imagem qualquer.
Seria muito trabalhoso para um grupo pequeno de pesquisadores catalogar 14 milhões de imagens baixadas, com rótulos de qual tipo de objeto aparece em cada uma delas, portanto eles recorreram ao serviço Mechanical Turk da Amazon, que disponibiliza as tarefas de rotulação em uma plataforma na qual pessoas do mundo inteiro podem se cadastrar para ganhar uma pequena quantia para cada rotulação (entre 1 e 6 dólares por hora) que fizerem, em outras palavras é uma plataforma de terceirização do trabalho de catalogação dos dados.
Apesar da imensa quantidade de pesquisa feita nas áreas de aprendizado não supervisionado ou semi-supervisionado – técnicas que requerem nenhuma ou pouca rotulação manual – e das inúmeras ferramentas desenvolvidas para automatizar o trabalho de organização dos dados ainda é premente um intenso emprego de trabalho humano para construir conjuntos de dados que possibilitem o desenvolvimento de modelos de inteligência artificial que apresentam bons resultados.
Recentemente foi descoberto que a OpenAI (empresa que desenvolveu o ChatGPT), para organizar o conjunto de dados de treinamento de alguma IA da família GPT, contratou os serviços de algumas empresas parceiras, entre elas a Sama, uma empresa da Califórnia que contrata trabalhadores no Quênia para realizar as rotulações dos dados por menos de 2 dólares a hora.
Neste caso o serviço consistia em rotular trechos de texto como sendo seguros ou tóxicos (discurso de ódio, violência explicita etc.). Um trabalhador empregado por essa empresa relatou ter sido exposto a uma grande quantidade de textos perturbadores – incluindo descrições gráficas de abuso de crianças, animais, assassinato e tortura – e que não conseguia parar de ter visões recorrentes sobre cenas relatadas nos textos a que foi obrigado a ler.
Casos como esse não são exceção, são a regra. Além do Mechanical Turk da Amazon e da Sama, outras empresas que prestam esse tipo de serviço são a ScaleAI (com sua fachada Remotasks), CloudFactory e Clickworker. Através delas as empresas do grande monopólio da tecnologia se aproveitam da superexploração do trabalho nos países periféricos para produzir recursos que alavancarão seus negócios.
Apropriação do trabalho de pesquisa para lucros privados
Outro fator fundamental no desenvolvimento da inteligência artificial foram as décadas de trabalho de pesquisa para criar, experimentar e refinar essas técnicas que agora são colocadas em uso, sendo o financiamento de pesquisa majoritariamente feito por iniciativas públicas em todo o mundo. Mesmo quando foi encabeçada por empresas privadas, como os famosos centros de pesquisa Google Brain, Deep Mind, Meta Research, isso apenas foi feito mediante um pesado investimento estatal a partir de incentivos fiscais ou mesmo investimento direto.
Como salientam Deivison Faustino e Walter Lippold no livro Colonialismo Digital: “A ‘mágica’ tecnológica que permite armazenar remotamente volumosas informações em nuvens virtuais ou mesmo a validação e a inclusão de novas transações de blockchain só são fisicamente possíveis, em seu estrondoso consumo de energia, mediante um volumoso investimento em capital constante e capital variável, dispostos entre infraestrutura pública ou privada de eletricidade, internet, hardwares supervelozes e, sobretudo, constante investimento em pesquisa e em força de trabalho altamente qualificada.”
Portanto, já há uma flagrante apropriação de dados e do fruto do trabalho a partir do momento que esses entes privados se aproveitam destes recursos para usar a inteligência artificial para lucro próprio, seja diretamente como um produto, vendendo o serviço de uso do ChatGPT, ou indiretamente como ferramenta que viabiliza outros produtos e abertura de novos mercados.
Há um falso discurso da democratização da IA referente a empresas que disponibilizam o arquivo, visto que as versões mais poderosas requerem supercomputadores que muitas vezes só estão disponíveis em centros de processamento e armazenamento de dados controlados por essas mesmas empresas (Azure da Microsoft, AWS da Amazon, GCP do Google), que cobram pelo serviço de usar esses recursos. De nada serve democratizar o acesso ao arquivo do programa se não há democratização das condições materiais de executá-lo.
Big techs operam através da lógica do Imperialismo
Olhando para as principais inteligências artificiais de linguagem (chamadas de grandes modelos de linguagem) existentes hoje, vemos que seu desenvolvimento foi principalmente capitaneado de duas formas: diretamente por empresas do monopólio da tecnologia, como o Gemini, desenvolvido pelo laboratório DeepMind do Google e o Lambda desenvolvido pelo Meta Research; ou por empresas que recentemente foram abocanhadas por Big Techs, sendo o caso do GPT – modelo da OpenAI, cujo maior acionista atualmente é a Microsoft – e do Claude da Anthropic AI, tendo Amazon e Google disputando recentemente a posição de maior investidor.
Na lista de melhores modelos de linguagem ChatBot Arena, entre os primeiros 10 colocados todos são modelos provenientes de empresas estadunidenses e nenhum deles tem seu arquivo fonte disponibilizado com livre acesso. Na mesma lista, em maio de 2023, a cena era bem diferente, 7 dos 10 primeiros colocados eram modelos com livre acesso, mais um sintoma de que nesse período de 1 ano o avanço do mercado de IA gerativa (IA que gera texto ou imagem) atiçou a sanha por lucro dos grandes monopólios de tecnologia, que se empenharam em adquirir agressivamente o que restava das empresas de IA e estabelecer o cercamento dos dados e dos modelos.
As empresas que tentam resistir minimamente a essa tendência monopolista sofrem intervenções das Big Techs através de manobras corporativas ou financeiras, eventos comuns nesse mundo empresarial. No entanto, enquanto em cenários normais essas manobras são arquitetadas de forma discreta, no caso das empresas de inteligência artificial, tem-se aberto mão da discrição em favor de uma rápida e agressiva aquisição.
É possível observar o papel que o cercamento dos data centers exerce de manter refém as empresas e promover a transferência de valor direcionada sempre aos grandes monopólios da tecnologia. A repentina demissão e, mais tarde, readmissão do diretor executivo da OpenAI, Sam Altman, em novembro de 2023 também se enquadra nesse processo, um dos resultados dessa bagunça foi que a Microsoft ganhou um membro observador no quadro de diretores da empresa.
O deslumbramento que essas novas tecnologias causam nas pessoas é crucial na propaganda imperialista que busca justificar a entrega total para os monopólios estrangeiros desse campo que seria tão estratégico para uma mínima soberania nacional.
Em 2014, o Google lançou a plataforma Workspace for Education, que oferecia armazenamento de dados gratuito e ilimitado para universidades. A adesão de universidades públicas brasileiras através de acordos rapidamente avançou, ao ponto que em 2022, 80% das instituições dependiam de serviços privados.
A conveniência e praticidade de integração dos serviços do Google eram atrativas a ponto de se deixar de lado debates do que poderia acarretar a entrega de dados de pesquisa nas mãos da Big Tech. Para piorar, depois de milhares de terabytes valiosos serem transferidos para seus centros de armazenamento e ter esse mercado dependente da sua plataforma, a empresa decidiu acabar com o armazenamento ilimitado gratuito.
Além dos dados de pesquisa, os dados da saúde, igualmente ou mais sensíveis, também estão sendo visados pelas BigTechs. Em um artigo na Le Monde Diplomatique, os pesquisadores Joyce Souza e Fabio Maldonado revelam como descobriram que dados do ConecteSUS estavam armazenados em servidores da Amazon, nos Estados Unidos. Há pouca regulação e regulamentação sobre como esses dados devem ser tratados, fazendo com que seja fácil para as multinacionais da tecnologia usá-los para treinar seus modelos de inteligência artificial.
No entanto, pior do que se apropriar indevidamente dos nossos dados para lucro próprio, o monopólio da tecnologia também pretende utilizar a inteligência artificial como forma de precarizar ainda mais as condições de trabalho. O Jornal A Verdade relatou o caso de um trabalhador que foi demitido em uma leva de 200 demissões após a empresa adotar o uso do ChatGPT como ferramenta de trabalho. Esse mês, o governador fascista do estado de São Paulo anunciou um plano para usar a mesma inteligência artificial na preparação de aulas da rede pública estadual, com o intuito de diminuir a contratação de professores e avançar no projeto de sucateamento da educação pública.
O que fazer
Na mão do capital, a tecnologia é um instrumento de dominação, cabe a nós a luta pra nos apropriarmos destas tecnologias e encontrar maneiras de subvertê-las para auxiliar a libertação da classe trabalhadora, como foi feito com o uso do rádio na revolução argelina ou na luta contra Ditadura Militar Fascista no Brasil.
Principalmente, devemos nos atentar à importância central das infraestruturas – as redes de telecomunicação e centros de servidores de processamento e armazenamento de dados – e quem detém seus controles. Enquanto há possibilidade de usá-los como estão, é importante, por exemplo, a ocupação e instrumentalização das redes digitais para agitação e propaganda do socialismo.
No entanto, quando isso se tornar uma ameaça para a burguesia, esses acessos serão cortados, como acontece hoje na Índia sob o governo de extrema-direita de Narendra Modi que corta acesso à internet de regiões inteiras em períodos de protestos. O mesmo cuidado deveria ser tomado caso seja feita a instrumentalização da inteligência artificial, a execução desses programas depende da aquisição de computadores custosos para consumidores comuns ou de aluguel de centros de processamento controlados pelas Big Techs. Se faz urgente a necessidade de ampliar o debate de como se apropriar das tecnologias digitais, seja daquelas já existentes e controladas pelo capital ou seja através do desenvolvimento alternativo de ferramentas para a luta proletária.
Ao mesmo tempo, precisamos integrar e radicalizar o debate sobre pautas importantes para caminhar em direção a uma soberania tecnológica: reformulação e expansão de regulamentações que já existem, como a Lei Geral de Proteção de Dados (LGPD) e o Marco Civil da Internet, regulamentação das redes digitais, regulamentação das plataformas (Uber, iFood etc.), com controle dos trabalhadores sobre estas plataformas; regulamentação do desenvolvimento e uso de inteligências artificiais, investimento público em infraestrutura para processamento e armazenamento de dados e o investimento público em pesquisa e desenvolvimento focado em soluções e plataformas que visem atender as necessidades da população ao invés de objetivar ganhos financeiros e meios de intensificar a exploração do trabalho.
Evidentemente, o imperialismo luta e lutará com garras e dentes para que tais propostas não cheguem sequer a ser consideradas pela democracia burguesa no nosso país. Por isso, enquanto pressionamos pelas pautas de interesse do nosso povo, lutamos pela revolução socialista, a única forma de construir um estado que atenda as necessidades da população ao invés do desejo de lucro da burguesia.