Ainda este ano, milhões de dispositivos Apple começarão a usar o Apple Intelligence, a versão da empresa de Cupertino da IA generativa que, entre outras coisas, permite criar imagens a partir de comandos de texto. No entanto, alguns membros da comunidade criativa estão descontentes com o que dizem ser a falta de transparência da empresa em relação às informações brutas que alimentam o modelo de IA que torna isso possível.
"Gostava que a Apple tivesse explicado ao público de uma forma mais transparente como recolheram os dados de treino," disse Jon Lam, um artista de videojogos e ativista dos direitos dos criadores, baseado em Vancouver, ao Engadget. "Acho que o anúncio deles não poderia ter vindo em pior altura."
Os criativos sempre foram alguns dos clientes mais leais da Apple, uma empresa cujo fundador posicionou famosa como estando na "interseção da tecnologia e das artes liberais". No entanto, fotógrafos, artistas conceptuais e escultores que falaram com o Engadget disseram estar frustrados com o relativo silêncio da Apple sobre como reúne dados para os seus modelos de IA.
A IA generativa só é tão boa quanto os dados em que os seus modelos são treinados. Para esse fim, a maioria das empresas ingeriu praticamente tudo o que encontraram na internet, consentimento ou compensação à parte. Quase 6 mil milhões de imagens usadas para treinar vários modelos de IA também vieram do LAION-5B, um conjunto de dados de imagens retiradas da internet. Em entrevista à Forbes, David Holz, CEO da Midjourney, disse que os modelos da empresa foram treinados com "apenas uma grande recolha da internet" e que "não há realmente uma maneira de obter cem milhões de imagens e saber de onde vêm."
Artistas, autores e músicos acusaram empresas de IA generativa de usarem o seu trabalho gratuitamente e de lucrar com ele, levando a mais de uma dúzia de processos judiciais apenas em 2023. No mês passado, grandes gravadoras, incluindo a Universal e a Sony, processaram os geradores de música AI Suno e Udio, startups avaliadas em centenas de milhões de dólares, por violação de direitos autorais. As empresas de tecnologia têm – ironicamente – defendido as suas ações e também assinado acordos de licenciamento com fornecedores de conteúdo, incluindo editores de notícias.
Alguns criativos pensaram que a Apple poderia fazer melhor. "É por isso que quis dar-lhes o benefício da dúvida," disse Lam. "Achei que iriam abordar a conversa ética de forma diferente."
Em vez disso, a Apple revelou muito pouco sobre a fonte dos dados de treino do Apple Intelligence. Num post publicado no blog de pesquisa de machine learning da empresa, foi escrito que, tal como outras empresas de IA generativa, recolhe dados públicos da web aberta usando o AppleBot, o seu rastreador web especialmente criado, algo que os seus executivos também mencionaram em palco. O chefe de IA e machine learning da Apple, John Giannandrea, também terá dito que "uma grande quantidade de dados de treino foi realmente criada pela Apple," mas não entrou em detalhes. E a Apple também terá assinado acordos com a Shutterstock e a Photobucket para licenciar imagens de treino, mas não confirmou publicamente essas relações. Enquanto o Apple Intelligence tenta ganhar elogios por uma abordagem supostamente mais focada na privacidade usando processamento no dispositivo e computação em nuvem personalizada, os fundamentos que sustentam o seu modelo de IA parecem pouco diferentes dos concorrentes.
A Apple não respondeu a perguntas específicas do Engadget.
Em maio, Andrew Leung, um artista baseado em Los Angeles que trabalhou em filmes como Black Panther, The Lion King e Mulan, chamou a IA generativa de "o maior assalto na história do intelecto humano" no seu testemunho perante a Assembleia Estadual da Califórnia sobre os efeitos da IA na indústria do entretenimento. "Quero salientar que quando usam o termo 'disponível publicamente' isso simplesmente não é suficiente," disse Leung numa entrevista. "Não se traduz automaticamente em uso justo."
Também é problemático para empresas como a Apple, disse Leung, oferecerem apenas uma opção para as pessoas optarem por sair depois de já terem treinado modelos de IA com dados para os quais não consentiram. "Nunca pedimos para fazer parte disso." A Apple permite que sites optem por não ser rastreados pelo AppleBot para dados de treino do Apple Intelligence – a empresa diz que respeita o robots.txt, um ficheiro de texto que qualquer site pode hospedar para dizer aos rastreadores para se afastarem – mas isso seria, no melhor dos casos, uma medida de contenção. Não está claro quando o AppleBot começou a rastrear a web ou como alguém poderia ter optado por sair antes disso. E, tecnologicamente, é uma questão em aberto como ou se os pedidos para remover informações dos modelos generativos podem sequer ser atendidos.
Este é um sentimento que até mesmo blogs direcionados a fãs da Apple estão a ecoar. "É dececionante ver a Apple manchar um conjunto de funcionalidades que de outra forma seria convincente (algumas das quais realmente quero experimentar) com práticas que não são melhores do que o resto da indústria," escreveu Federico Viticci, fundador e editor-chefe do blog de entusiastas da Apple MacStories.
Adam Beane, um escultor baseado em Los Angeles que criou uma escultura de Steve Jobs para a Esquire em 2011, usou exclusivamente produtos Apple durante 25 anos. Mas disse que a relutância da empresa em ser franca com a fonte dos dados de treino do Apple Intelligence o desiludiu.
"Estou cada vez mais zangado com a Apple," disse ele ao Engadget. "Temos de estar suficientemente informados e experientes para saber como optar por não treinar a IA da Apple e depois confiar numa corporação para honrar os nossos desejos. Além disso, tudo o que vejo a ser oferecido como opção para sair é continuar a treinar a IA deles com os seus dados."
Karla Ortiz, uma ilustradora de São Francisco, é uma das queixosas num processo de 2023 contra a Stability AI e a DeviantArt, as empresas por trás dos modelos de geração de imagens Stable Diffusion e DreamUp, respetivamente, e Midjourney. "A verdade é que, para a IA generativa funcionar como está, [ela] depende de um enorme excesso e violações de direitos, privados e intelectuais," escreveu ela num tópico viral no X sobre o Apple Intelligence. "Isso é verdade para todas as empresas de IA [generativa], e à medida que a Apple empurra essa tecnologia goela abaixo, é importante lembrar que eles não são uma exceção."
A indignação contra a Apple é também parte de um sentido maior de traição entre os profissionais criativos contra empresas de tecnologia cujas ferramentas dependem para realizar o seu trabalho. Em abril, um relatório da Bloomberg revelou que a Adobe, que faz o Photoshop e várias outras aplicações usadas por artistas, designers e fotógrafos, usou imagens de origem questionável para treinar o Firefly, o seu próprio modelo de geração de imagens que a Adobe afirmava ter sido "eticamente" treinado. E, no início deste mês, a empresa foi forçada a atualizar os seus termos de serviço para esclarecer que não usaria o conteúdo dos seus clientes para treinar modelos de IA generativa após a indignação dos clientes. "Toda a comunidade criativa foi traída por todas as empresas de software em que confiávamos," disse Lam. Embora não seja viável para ele afastar-se completamente dos produtos Apple, está a tentar reduzir o uso – planeia trocar o seu iPhone por um Light Phone III.
"Acho que há um sentimento crescente de que a Apple está a tornar-se igual às outras," disse Beane. "Uma grande corporação que está a priorizar os seus lucros em detrimento da vida das pessoas que usam o seu produto."
Via Engadget
Comments