Como as fotos de seus filhos estão alimentando a tecnologia de vigilância

Início » Cibersegurança » Como as fotos de seus filhos estão alimentando a tecnologia de vigilância

Read Time:14 Minute, 10 Second

As fotos de Chloe e Jasper Papa quando crianças são tipicamente patetas: sorrindo com os pais; metendo a língua para fora; fantasiado para o Halloween. Sua mãe, Dominique Allman Papa, os carregou no Flickr depois de entrar no site de compartilhamento de fotos em 2005.

Nenhum deles poderia prever que 14 anos depois, essas imagens residiriam em um banco de dados de reconhecimento facial sem precedentes, chamado MegaFace . Contendo a semelhança de quase 700.000 indivíduos, ele foi baixado por dezenas de empresas para treinar uma nova geração de algoritmos de identificação de rosto, usados para rastrear manifestantes , investigar terroristas, detectar jogadores problemáticos e espionar o público em geral.

“É nojento e desconfortável”, disse Mx. Papa, que agora tem 19 anos e estuda em Oregon. “Eu gostaria que eles tivessem me perguntado primeiro se eu queria fazer parte disso. Acho que a inteligência artificial é legal e quero que seja mais inteligente, mas geralmente você pede às pessoas que participem da pesquisa. Eu aprendi isso na biologia do ensino médio. ”

Chloe Papa Amanda Lucier para o New York Times

Por lei, a maioria dos americanos no banco de dados não precisa receber permissão – mas os Papas deveriam ter sido.

Como residentes de Illinois, eles são protegidos por uma das mais rigorosas leis de privacidade do estado: a Lei de Privacidade da Informação Biométrica, uma medida de 2008 que impõe sanções financeiras pelo uso das impressões digitais de um cidadão de Illinois ou pela digitalização facial sem consentimento. Aqueles que usaram o banco de dados – empresas como Google, Amazon, Mitsubishi Electric, Tencent e SenseTime – parecem não ter conhecimento da lei e, como resultado, podem ter uma enorme responsabilidade financeira, de acordo com vários advogados e professores de direito familiarizados com a legislação.

Como nasceu o MegaFace

Como os Papas e centenas de milhares de outras pessoas acabaram no banco de dados? É uma história indireta.

Na infância da tecnologia de reconhecimento facial, os pesquisadores desenvolveram seus algoritmos com o consentimento claro dos sujeitos: na década de 1990, as universidades tinham voluntários que frequentavam estúdios para serem fotografados de vários ângulos. Mais tarde, os pesquisadores se voltaram para métodos mais agressivos e furtivos para reunir rostos em maior escala , usando câmeras de vigilância em cafeterias, campus universitários e espaços públicos e raspar fotos postadas online.

Segundo Adam Harvey, um artista que rastreia os conjuntos de dados , provavelmente existem mais de 200, contendo dezenas de milhões de fotos de aproximadamente um milhão de pessoas. (Alguns dos conjuntos são derivados de outros, portanto, os números incluem algumas duplicatas.) Mas esses caches tinham falhas. As imagens de vigilância geralmente são de baixa qualidade, por exemplo, e a coleta de fotos da Internet tende a render muitas celebridades.

Em junho de 2014, buscando promover a causa da visão computacional, o Yahoo lançou o que chamou de ” a maior coleção pública de multimídia já lançada “, com 100 milhões de fotos e vídeos. O Yahoo obteve as imagens – todas com Creative Commons ou licenças de uso comercial – do Flickr, uma subsidiária.

Os criadores do banco de dados disseram que sua motivação era equilibrar o campo do aprendizado de máquina. Os pesquisadores precisam de enormes quantidades de dados para treinar seus algoritmos, e os funcionários de apenas algumas empresas ricas em informações – como Facebook e Google – tiveram uma grande vantagem sobre todos os outros.

“Queríamos capacitar a comunidade de pesquisa, fornecendo a eles um banco de dados robusto”, disse David Ayman Shamma, diretor de pesquisa do Yahoo até 2016 e ajudou a criar o projeto Flickr. Os usuários não foram notificados de que suas fotos e vídeos foram incluídos, mas Shamma e sua equipe construíram o que consideravam uma salvaguarda.

Eles não distribuíram as fotos dos usuários diretamente, mas sim links para as fotos; dessa forma, se um usuário excluísse as imagens ou as tornasse privadas, elas não seriam mais acessíveis através do banco de dados.

Mas essa salvaguarda era falha. O New York Times encontrou uma vulnerabilidade de segurança que permite que as fotos de um usuário do Flickr sejam acessadas mesmo depois de terem sido privadas. (Scott Kinzie, porta-voz da SmugMug, que adquiriu o Flickr do Yahoo em 2018, disse que a falha “afeta potencialmente um número muito pequeno de nossos membros hoje, e estamos trabalhando ativamente para implantar uma atualização o mais rápido possível”. Ben MacAskill, o diretor de operações da empresa, acrescentou que a coleção do Yahoo foi criada “anos antes de nosso envolvimento com o Flickr”.)

Além disso, alguns pesquisadores que acessaram o banco de dados simplesmente baixaram versões das imagens e as redistribuíram, incluindo uma equipe da Universidade de Washington. Em 2015, dois dos professores de ciência da computação da escola – Ira Kemelmacher-Shlizerman e Steve Seitz – e seus alunos de pós-graduação usaram os dados do Flickr para criar o MegaFace.

Contendo mais de quatro milhões de fotos de cerca de 672.000 pessoas, era uma promessa profunda para testar e aperfeiçoar algoritmos de reconhecimento de rosto.

Monitorando uigures e divulgando atores pornográficos

Importante para os pesquisadores da Universidade de Washington, o MegaFace incluiu crianças como Chloe e Jasper Papa. Os sistemas de reconhecimento de rosto tendem a apresentar um desempenho ruim nos jovens, mas o Flickr ofereceu uma chance de melhorar isso com uma pechincha de rostos de crianças, pela simples razão de que as pessoas adoram postar fotos de seus filhos online.

Em 2015 e 2016, a Universidade de Washington realizou o “Desafio MegaFace”, convidando grupos que trabalham com tecnologia de reconhecimento de rosto a usar o conjunto de dados para testar o desempenho de seus algoritmos.

A escola pediu às pessoas que baixavam os dados que concordassem em usá-los apenas para “fins não comerciais e educacionais”. Mais de 100 organizações participaram, incluindo Google, Tencent, SenseTime e NtechLab. No total, de acordo com um comunicado de imprensa da universidade de 2016 , “mais de 300 grupos de pesquisa” trabalharam com o banco de dados. Ele foi citado publicamente por pesquisadores da Amazon e, de acordo com Harvey , Mitsubishi Electric e Philips.

Algumas dessas empresas foram criticadas pela maneira como os clientes implementaram seus algoritmos: a tecnologia do SenseTime foi usada para monitorar a população uigur na China , enquanto o NtechLab foi usado para combater atores pornográficos e identificar estranhos no metrô na Rússia.

O diretor de marketing do SenseTime, June Jin, disse que os pesquisadores da empresa usavam o banco de dados MegaFace apenas para fins acadêmicos. “Os pesquisadores precisam usar o mesmo conjunto de dados para garantir que seus resultados sejam comparáveis entre si”, escreveu Jin em um email. “Como o MegaFace é o banco de dados mais amplamente reconhecido do gênero, tornou-se o treinamento e o teste de reconhecimento facial de fato para a comunidade acadêmica e de pesquisa global.”

O porta-voz da NtechLab, Nikolay Grunin, disse que a empresa excluiu o MegaFace depois de participar do desafio e acrescentou que “a principal construção do nosso algoritmo nunca foi treinada nessas imagens”. O Google se recusou a comentar.

Uma porta-voz da Universidade de Washington se recusou a disponibilizar os principais pesquisadores do MegaFace para entrevistas, dizendo que “passaram para outros projetos e não têm tempo para comentar sobre isso”. Os esforços para contatá-los individualmente não tiveram êxito.

A criação do MegaFace foi financiada em parte pela Samsung, Faculty Research Award do Google e pela National Science Foundation / Intel.

Nos últimos anos, Kemelmacher-Shlizerman vendeu uma empresa de imagens trocadoras de rosto para o Facebook e avançada tecnologia de falsificação profunda, convertendo clipes de áudio de Barack Obama em um vídeo realista e sintético dele fazendo um discurso. Ela agora está trabalhando em um “projeto de moonshot” no Google.

‘Que diabos? Isso é louco

O MegaFace permanece disponível ao público para download. Quando o The New York Times solicitou recentemente o acesso, ele foi concedido em um minuto.

MegaFace não contém nomes de pessoas, mas seus dados não são anonimizados. Um porta-voz da Universidade de Washington disse que os pesquisadores queriam honrar as licenças Creative Commons das imagens. Como resultado, cada foto inclui um identificador numérico vinculado à conta do fotógrafo original do Flickr. Dessa forma, o Times conseguiu rastrear muitas fotos no banco de dados para as pessoas que as tiraram.

“Que diabos? Isso é loucura ”, disse Nick Alt, empresário de Los Angeles, ao saber que suas fotos estavam no banco de dados, incluindo fotos que ele tirou de crianças em um evento público em Playa Vista, Califórnia, uma década atrás.

“A razão pela qual eu fui ao Flickr originalmente foi que você poderia definir a licença como não comercial. Absolutamente, eu não deixaria minhas fotos serem usadas em projetos de aprendizado de máquina. Eu me sinto um idiota por postar essa foto. Mas eu fiz isso há 13 anos, antes que a privacidade fosse uma coisa. ”

Outro assunto, que pediu para ser identificado como J., é agora um estudante do ensino médio de 15 anos em Las Vegas. Fotos dele quando criança estão no banco de dados do MegaFace, graças ao tio de publicá-las em um álbum do Flickr após uma reunião de família há uma década. J. estava incrédulo por não ser ilegal colocá-lo no banco de dados sem sua permissão e ele está preocupado com as repercussões.

Desde o ensino médio, ele faz parte de um programa da Associação da Força Aérea chamado CyberPatriot, que tenta direcionar jovens com habilidades de programação para carreiras em inteligência e forças armadas. “Sou muito protetor com minha pegada digital por causa disso”, disse ele. “Tento não postar fotos minhas online. E se eu decidir trabalhar para a NSA? ”

Para J., Alt e a maioria dos outros americanos nas fotos, há pouco recurso. A lei de privacidade geralmente é tão permissiva nos Estados Unidos que as empresas são livres para usar o rosto de milhões de pessoas sem seu conhecimento para impulsionar a disseminação da tecnologia de reconhecimento de rosto. Mas há uma exceção.

Em 2008, Illinois aprovou uma lei presciente que protege os “identificadores biométricos e informações biométricas” de seus residentes. Dois outros estados, Texas e Washington, aprovaram suas próprias leis de privacidade biométrica, mas não são tão robustas quanto a do Illinois, que proíbe estritamente entidades privadas de coletar, capturar, comprar ou obter a biometria de uma pessoa – incluindo uma varredura de sua “geometria da face” – sem o consentimento dessa pessoa.

“As fotos em si não são cobertas pela Lei de Privacidade da Informação Biométrica, mas a digitalização das fotos deve ser. O mero uso de dados biométricos é uma violação do estatuto ”, disse Faye Jones, professora de direito da Universidade de Illinois. “Usar isso em um concurso algorítmico quando você não notificou as pessoas é uma violação da lei.”

Residentes de Illinois como os Papas cujas impressões faciais são usadas sem a permissão deles têm o direito de processar, disse Jones, e têm direito a US $ 1.000 por uso, ou US $ 5.000 se o uso for “imprudente”. O Times tentou medir quantas pessoas de Illinois estão no banco de dados MegaFace; uma abordagem, usando informações de localização autorreferidas, sugeriu 6.000 indivíduos, e outra, usando metadados de identificação geográfica, indicou até 13.000.

Sua biometria provavelmente foi processada por dezenas de empresas. De acordo com vários especialistas jurídicos em Illinois, a responsabilidade combinada pode chegar a mais de um bilhão de dólares e formar a base de uma ação coletiva.

“Temos muitos advogados de ação coletiva ambiciosos aqui em Illinois”, disse Jeffrey Widman, sócio-gerente da Fox Rothschild em Chicago. “A lei está em vigor em Illinois desde 2008, mas foi basicamente ignorada por uma década. Garanto que, em 2014 ou 2015, essa responsabilidade potencial não estava no radar de ninguém. Mas a tecnologia já alcançou a lei. ”

Um caso de US $ 35 bilhões contra o Facebook

É notável que a lei de Illinois exista. De acordo com Matthew Kugler, professor de direito da Northwestern University que pesquisou a lei de Illinois , foi inspirado pela falência de 2007 de uma empresa chamada Pay by Touch, que tinha as impressões digitais de muitos americanos, incluindo os de Illinois, em arquivo; havia preocupações de que pudesse vendê-los durante sua liquidação.

Ninguém da indústria de tecnologia pesou na conta, de acordo com registros legislativos e de lobby.

“Quando a lei foi aprovada, ninguém que agora está preocupado com ela estava pensando sobre o assunto”, disse Kugler. O Vale do Silício está ciente da lei agora. A Bloomberg News informou em abril de 2018 que os lobistas do Google e do Facebook estavam tentando enfraquecer suas disposições.

Mais de 200 ações coletivas alegando uso indevido da biometria dos residentes foram iniciadas em Illinois desde 2015, incluindo um caso de US $ 35 bilhões contra o Facebook por usar o reconhecimento facial para marcar pessoas em fotos. Esse processo ganhou força em agosto, quando o Tribunal de Apelações do Nono Circuito dos Estados Unidos rejeitou os argumentos da empresa de que as pessoas não sofriam “danos concretos”.

Nos últimos anos, as empresas de tecnologia têm pisado mais levemente nos estados com a legislação biométrica. Quando o Google lançou um recurso em 2018 que combinava selfies com obras de arte famosas, as pessoas em Illinois e no Texas não puderam usá-lo . E as câmeras de segurança Nest do Google não oferecem um recurso padrão para reconhecer rostos familiares em Illinois.

“É assustador você me encontrar. Eu sempre vivi com a filosofia de que o que eu publiquei era público, mas não podia imaginar isso ”, disse Wendy Piersall, editora e membro do Conselho da Cidade em Woodstock, Illinois, cujas fotos, juntamente com as três crianças, estavam no banco de dados MegaFace.

“Não podemos usar o aplicativo divertido de arte; por que você está usando o rosto de nossos filhos para testar seu software? ”ela adicionou. “Minhas fotos lá são identificadas geograficamente para Illinois. Não é difícil descobrir onde essas fotos foram tiradas. Eu não sou uma pessoa que processa felizmente, mas gostaria de encorajar outra pessoa a ir atrás disso. ”

Niilismo de privacidade

Dominique e George Papa com seu filho Jasper em sua casa em Evanston, Illinois, no início deste mês. Taylor Glascock para o New York Times

Alguns dos processos de Illinois foram resolvidos ou julgados improcedentes, mas a maioria está ativa, e Kugler, professor de direito do Noroeste, observou que as questões legais básicas permanecem sem resposta. Não está claro qual seria a responsabilidade legal para uma empresa que tira fotos enviadas em Illinois, mas processa os dados faciais em outro estado ou até em outro país.

“Os réus serão criativos na busca de argumentos, porque ninguém quer ficar preso segurando esta batata quente cara”, disse ele.

Um porta-voz da Amazon Web Services disse que o uso do conjunto de dados é “compatível com o BIPA”, enquanto se recusava a explicar como. Mario Fante, porta-voz da Philips, escreveu em um e-mail que a empresa “nunca tinha conhecimento de nenhum residente de Illinois incluído no conjunto de dados mencionado acima”.

Victor Balta, porta-voz da Universidade de Washington, disse: “Todos os usos das fotos no banco de dados dos pesquisadores são legais. A UW é uma universidade pública de pesquisa, não uma entidade privada, e a lei de Illinois visa entidades privadas. ”

Alguns dos illinoisianos que encontramos no MegaFace e contatamos eram indiferentes ao uso de seus rostos.

“Eu sei que quando você carrega informações on-line, elas podem ser usadas de maneiras inesperadas, então acho que não estou surpresa”, disse Chris Scheufele, desenvolvedor web em Springfield. “Quando você envia informações para a Internet e as disponibiliza para consumo público, deve esperar que sejam raspadas”.

E os assuntos de suas fotos? Scheufele riu. “Eu não conversei com minha esposa sobre isso”, disse ele.

” Niilismo da privacidade ” é um termo cada vez mais familiar para desistir de tentar controlar dados sobre si mesmo na era digital. O que aconteceu com Chloe Papa poderia, dependendo da sua perspectiva, argumentar por extrema vigilância ou total resignação: quem poderia prever que um instantâneo de uma criança pequena em 2005 contribuísse, uma década e meia depois, para o desenvolvimento de sangramentos? tecnologia de vigilância?

“Nós nos acostumamos a trocar conveniência por privacidade, de modo que entorpecemos nossos sentidos sobre o que está acontecendo com todos os dados coletados sobre nós”, disse Jones, professora de Direito. “Mas as pessoas estão começando a acordar.”

FONTE: NY Times

POSTS RELACIONADOS

Ataques de envenenamento de dados em modelos de IA: o desafio da integridade das informações

Modelos de inteligência artificial dependem da qualidade dos dados utilizados durante seu treinamento. Cada informação inserida na base de aprendizado

Ler mais

24/07/2026

A evolução do DLP para a era dos LLMs: como proteger dados confidenciais em ferramentas de IA corporativas

A inteligência artificial generativa entrou definitivamente na rotina das empresas. Equipes de desenvolvimento utilizam assistentes para escrever código, áreas jurídicas

Ler mais

22/07/2026

Quem controla as chaves criptográficas protege mais do que os dados

A criptografia se consolidou como um dos principais mecanismos de proteção da informação em ambientes digitais. Empresas investem em soluções

Ler mais

20/07/2026

Como as fotos de seus filhos estão alimentando a tecnologia de vigilância

Como nasceu o MegaFace

Monitorando uigures e divulgando atores pornográficos

‘Que diabos? Isso é louco

Um caso de US $ 35 bilhões contra o Facebook

Niilismo de privacidade

POSTS RELACIONADOS

Ataques de envenenamento de dados em modelos de IA: o desafio da integridade das informações

A evolução do DLP para a era dos LLMs: como proteger dados confidenciais em ferramentas de IA corporativas

Quem controla as chaves criptográficas protege mais do que os dados

Categorias

Posts Recentes

Ataques de envenenamento de dados em modelos de IA: o desafio da integridade das informações

A evolução do DLP para a era dos LLMs: como proteger dados confidenciais em ferramentas de IA corporativas

Quem controla as chaves criptográficas protege mais do que os dados

AI agents no seu site: quais bots confiar e como proteger sua aplicação

Neotel acelera inovação interna e destaca projetos de inteligência artificial aplicados à cibersegurança

As empresas brasileiras estão preparadas para corrigir uma falha crítica em apenas 72 horas?

Feito por VP DIGITAL