top of page

Inteligência Artificial e Arte

  • Foto do escritor: Antonio Moscatelli
    Antonio Moscatelli
  • 10 de jan. de 2023
  • 3 min de leitura

Antonio Alberto Moreira Moscatelli 21/12/22


A internet é um lugar assustadoramente mágico. Há pelo menos 7 anos, as máquinas já sabiam identificar objetos em imagens e formar uma legenda natural. Foi quando um grupo de pesquisadores da Universidade de Toronto decidiu tentar o caminho inverso em 2016: e se déssemos ao computador a legenda para que ele criasse a imagem? Hoje, com a evolução da Inteligência Artificial e o avanço das redes neurais, vivemos a era em que esses “geradores de imagens” passam a trazer perguntas sobre a ética de seu banco de dados e da automação de todo trabalho criativo.

Podemos até pensar que a geração de imagens completamente novas por computadores não é tão nova assim, afinal, em 2018 um retrato gerado por IA foi leiloado por mais de 400 mil dólares. Mas os modelos dos quais falamos na atualidade são mais sofisticados e para isso precisamos entender como funcionam.

Primeiro, é necessário criar um banco de dados, que nada mais é do que uma coleção de imagens tiradas da internet junto de suas legendas. Como fotos de notícias com descrições de alt-text para pessoas com deficiência visual. Caso o objetivo seja criar um programa que gere rostos, coleta-se retratos; caso o objetivo sejam paisagens, coleta-se paisagens. Entretanto, as versões mais atualizadas de softwares como Dall-E e Midjourney devem ser capazes de gerar qualquer tipo de imagem, logo, seus bancos de dados são não só imensos, como diversos.

Mas para ter um resultado, o modelo não realiza a tarefa de simplesmente pesquisar imagens relacionadas com o texto inserido e daí copiar e colar pixels na imagens criada, é preciso treiná-lo. Em segundo lugar, de modo geral e resumido, é aqui que entra o aspecto da inteligência artificial nessa revolução de texto-para-imagens. Usando as redes neurais, o modelo tem o objetivo de conseguir diferenciar imagens e para isso cria centenas de milhares de variáveis que o permitem classifica-las no banco de dados de acordo com suas legendas. Dessa forma, por exemplo, com um banco de 650 milhões de imagens, DALL-E criou 12 bilhões de variáveis, a maioria das quais nós não conseguiríamos nem nomear ou compreender.

Com tantas variáveis criadas pelo modelo de deep learning com redes neurais, surge o que é chamado de espaço latente: como se as 12 bilhões de variáveis gerassem um espaço matemático com muitas dimensões (500 no caso da Midjourney) em que cada ponto representaria uma possível imagem a ser gerada. Por fim, através de um processo chamado de difusão, o modelo gera uma imagem pouco reconhecível que vai tomando forma através de algumas repetições até ficar compreensível, um processo que será único cada vez que o programa for rodado devido de um pouco de aleatoriedade no processo.

Assim, com uma capacidade cada vez maior e mais democratizada de “criar arte”, o avanço dos geradores de imagem traz preocupações quanto ao trabalho de ilustradores, animadores, artistas visuais, diretores de arte e até mesmo músicos.

Artistas como James Gurney, famoso pelas suas pinturas de paisagens, estiveram entre os primeiros a ter seu estilo de ilustração imitado pelas IAs. Tornando-se uma referência, basta que qualquer um com acesso ao software insira o nome de um artista desejado junto de qualquer pedido que os modelos geram imagens que copiam seu estilo, mas não diretamente um quadro específico. E nesse ponto alcançamos o maior problema: para criar os bancos de dados com milhões e milhões de imagens que permitem que o estilo de artistas famosos seja copiado, as empresas que os criaram não pediram permissão a nenhum dos artistas. É como se as milhares de horas dedicadas ao aperfeiçoamento da prática pudessem ser analisadas, aprendidas e reproduzidas em minutos para qualquer um com acesso ao programa.

De certa forma, a liberdade que esses modelos de texto-para-imagem traz, vem sido comparada com o caminho da fotografia: antes uma forma de arte cara da qual todos poderiam participar, mas hoje totalmente democratizada em que cada indivíduo possui uma câmera no bolso. Entretanto, mesmo tendo sido extremamente difundida, fotógrafos profissionais e outros artistas e pintores não perderam seus antigos empregos. Para alguns, DALL-E e Midjourney tão pouco roubaram todos os postos de trabalho, mas mesmo assim, ainda nos sobram algumas questões éticas sem resolução.




Referências:

 
 
 

Comments


  • Instagram
  • Facebook
  • Twitter
  • LinkedIn
  • YouTube
  • TikTok

© 2022 Jovem Político.

bottom of page