Metodologias de extração e visualização de imagens da #protestoes

22 de julho de 2013

por Johanna Honorato


O projeto Visagem, com sua pesquisa nas imagens com hashtag “#protestoes”, retiradas do Facebook e do Instagram, objetivou identificar padrões e ressonâncias entre as imagens das duas ferramentas onlines. A partir dessa análise, foi possível perceber diferenças estruturais das ferramentas que influenciam no processo de produção fotográfica e que caracteriza as imagens compartilhadas e o caráter imagético do próprio movimento.

Por uma questão de tempo e necessidade de analisar as imagens conforme as manifestações ocorriam, nossa extração de imagens aconteceu manualmente, através do download de cada imagem, copiando seus dados como a data e o usuário que a compartilhou. Essa extração manual, nos deu ainda mais base para entender as diferenças entre esses sites de redes sociais.

Como o Facebook organiza as informações seguindo a ideia do que interessa mais ao usuário, segundo seu histórico de visualizações, comentários e opções de curtir, as imagens que apareciam pela busca da hashtag, não seguiam um padrão cronológico ou de mais acessos. Isso nos leva a conclusão de que se a pesquisa fosse realizada por um outro usuário, a ordem e as informações que apareceriam seriam outras. Além disso, suas imagens não seguem um padrão de tamanho como as do Instagram, que são reformatadas para o formato 4:3, padrão semelhante ao da Polaroid.

Para extrair as imagens do Instagram, usamos o visualizador Webstagram, por possibilitar a visualização de uma maior quantidade de imagens em uma única página e por facilitar o download dessas imagens. Como os padrões de data do Instagram seguem a lógica do tempo que passa, organizamos as imagens em dois grupos, semana 1(17/07 – 22/06) e semana 2 (23/06 – 24/06), já que não podemos precisar o dia em que as imagens foram postadas.

A metodologia utilizada para criar as visualizações das imagens do Facebook (500 imagens) e Instagram (492 imagens), que continham a hashtag “#protestoes”, baseou-se no software ImageJ e em uma macro desenvolvida especificamente para o programa, chamada de ImagePlot.

O ImageJ é um programa java, de domínio público, utilizado para o processamento de imagens, disponível para os sistemas operacionais Windows, Mas OS, Mas OS X e Linux, rodando em qualquer computador que contenha Java 1.4 ou posterior.  A macro ImagePlot¹, utilizada juntamente com o software ImageJ, foi desenvolvida pelo Grupo de Estudos de Software, de NY, cujo fundador e diretor é o professor pesquisador Lev Manovich. Ambos estão disponíveis para download no site do Software Studies (softwarestudies.com), tendo incorporados aos seus arquivos de instalação, alguns exemplos de imagens e datasets para as primeiras experiências práticas com o programa.

No projeto, “Visagem”, as 500 imagens capturadas do Instagram e as 492 imagens do Facebook foram organizadas em um dataset contendo “Nome do Arquivo”, “ID”, “Brilho Médio”, “Saturação Média”, “Cor Média”, “Legenda” e “Usuário”. O dataset foi criado no excel, sendo cada uma dessas divisões uma coluna na tabela, e posteriormente transformado para a extensão de texto separado por tabulações (.txt) para que pudesse ser lido pela macro ImagePlot. As medições para descobrir brilho, saturação e cor de cada imagem foram conseguidas através de outra macro chamada “measurements”, disponibilizada junto com o ImageJ.

A coluna “Nome do Arquivo” consta como a identificação da imagem no computador. É por meio dessa coluna que o programa relaciona cada linha da tabela com determinada imagem na pasta. A linha da tabela contém as informações como brilho, saturação e cor da imagem correspondente a ela. Apesar de ser uma classificação fácil, feita através de números, uma dificuldade percebida foi que ao numerar as imagens sequencialmente (1.jpg; 2.jpg; 3.jpg e assim por diante) o ImageJ, ao rodar a macro “measurements”, organizava os resultados de forma confusa, seguindo o raciocínio de que as primeiras imagens eram aquelas que começavam com o número um (1.jpg; 10.jpg; 11.jpg; (…) 100.jpg). Sendo assim, uma forma de contornar o problema foi nomear as imagens com uma quantidade de zeros proporcional ao número de imagens (da imagem 001.jpg à imagem 099.jpg), gerando as informações na ordem correta das imagens.

Os valores para “Brilho Médio”, “Saturação Média” e “Cor Média” foram obtidos, como dito anteriormente, por meio da macro “measurements” e depois anexados à nova tabela de metadados que estava sendo construída pelos pesquisadores.

As colunas “Legenda” e “Usuários” estão estritamente ligadas. Os usuários são os perfis (ou páginas, no caso do Facebook) que postaram ou compartilharam as imagens que continham a hashtag “#protestoes”. Já a “Legenda” foi uma maneira encontrada para tornar viável a utilização dos usuários como um dado na criação das visualizações, já que a inserção de texto como um parâmetro para o gráfico não era possível.

No momento de gerar os gráficos alguns problemas ficaram evidentes. De modo geral, as visualizações tiveram de ser geradas utilizando computadores mais potentes (por exemplo, o computador utilizado possui 32 GB de RAM e processador Intel Core 7), devido à necessidade de grande quantidade de memória e de maior eficácia no processamento das imagens. Um detalhe que pôde ser percebido nas imagens do Instagram foi que a utilização de filtros em preto e branco, alterava a composição da imagem transformando-a em Grayscale (LUT) e acarretando um erro de leitura na macro. A solução encontrada foi converter todas as que continham esse metadado para RGB, não alterando as características básicas da imagem, mas viabilizando a renderização dos gráficos.

¹ O ImagePlot foi desenvolvido pelo Software Studies Initiative com apoio do National Endowment for Humanities (NEH), do California Institute for Telecommunications and Information Technology (Calit2), e do Center for Research in Computing and the Arts (CRCA) nos EUA.

Compartilhe

Comentários