Ética ao analisar dados

26/01/2022

Resenha de Livro

O que é ética?

Ao longo da história, vários autores escreveram sobre a ética e a sua visão sobre esse assunto, que é de extrema importância em quase tudo que fazemos. Para este post, resolvemos trazer uma frase dita pelo filósofo brasileiro Mario Sérgio Cortella que nos ajudará a refletir sobre o tema.

“Ética é o conjunto de valores e princípios que usamos para responder a três grandes questões da vida: (1) quero?; (2) devo?; (3) posso? Nem tudo que eu quero eu posso; nem tudo que eu posso eu devo; e nem tudo que eu devo eu quero. Você tem paz de espírito quando aquilo que você quer é ao mesmo tempo o que você pode e o que você deve.”

Você pode pensar nessa definição como referência toda vez que tratarmos de ética ao longo do texto.

E o que é uma análise de dados?

Bom, podemos dizer de uma forma bem direta que analisar dados é transformar dados em informação. Dados brutos são gerados a todo momento de diferentes maneiras. Basicamente toda ação realizada pelo ser humano é capaz de gerar dados hoje em dia. E por que é necessário analisar esses dados? Os dados em sua forma bruta dificilmente será capaz de transmitir informações em geral.

Por exemplo, imagine que você resolveu pesquisar informações sobre casos de gestantes e puérperas notificados com Síndrome Respiratória Aguda Grave (SRAG), e a única coisa que encontra é a base SIVEP Gripe (Sistema de Informação da Vigilância Epidemiológica da Gripe) disponibilizada pelo Ministério da Saúde. Você seria capaz de olhar aquela gigantesca base de dados e extrair as informações que deseja? Dificilmente. Por isso, a análise de dados se faz necessária, pois a partir dela é que são geradas informações capazes de responder a perguntas e questionamentos levantados necessários para a tomada de uma decisão.

Vamos adentrar um pouco mais nesse assunto ao longo do post. Ah, e caso tenha tido interesse em se atualizar sobre casos de gestantes e puérperas notificados com SRAG, nós temos um painel interativo com diversas análises e informações já prontas (não precisa tentar tirar informações dos dados brutos, por exemplo, rs). Você pode acessá-lo clicando aqui.

Por que precisamos da ética na análise de dados?

Apesar de ética e análise de dados parecerem duas coisas sem conexão alguma, diversos problemas podem acontecer quando a análise de dados é feita sem ética. Sabemos que toda profissão tem o seu código de ética, mas já imaginou se alguma delas não tivesse? O que aconteceria com a Medicina? O médico poderia focar apenas em seus lucros, cobrar valores exorbitantes para problemas simples, pessoas sem qualificação poderiam realizar cirurgias, produtos que causam danos à saúde poderiam ser facilmente encontrados, entre outros problemas. O mesmo caos poderíamos pensar a respeito do Direito, da Psicologia, da Engenharia Civil… e por que não na análise de dados. Sobre esse último é o que tentaremos explicar neste post.

Para começar, vamos dar exemplos de dois casos famosos que envolveram dados.

Em 2018, o Ministério Público constatou o vazamento de dados pessoais do site de comércio eletrônico Netshoes de mais de 2 milhões de pessoas. Foram vazados dados como nome, CPF, e-mail, data de nascimento, histórico de compras, entre outros. Devido à ausência de uma lei voltada para a proteção de dados pessoais, a empresa só deu início ao processo de comunicar seus clientes a respeito do vazamento após um período de mais de três meses do acontecido, deixando, portanto, as vítimas sem qualquer conhecimento do problema que lhes cabiam.

Outro caso a ser mencionado é o escândalo da Cambridge Analytica que envolveu o Facebook. Para resumir, a empresa utilizou um aplicativo para coletar informações de mais de 80 milhões de usuários do Facebook sem seu conhecimento. A coleta de dados começou em 2014 envolvendo usuários que quiseram participar do teste promovido por meio do aplicativo. O grande problema foi que, ao concordarem em participar dos testes, as pessoas estavam entregando, sem saber, não só as suas informações privadas, mas também a de todos os seus amigos. Esses dados incluíam detalhes sobre nome, identidade, moradia, gostos e hábitos etc. A empresa Cambridge Analytica utilizou esses dados para traçar perfis psicológicos dos usuários, e com essas informações influenciar diversas eleições por meio de propaganda política direcionada. “Fornecer a informação certa à pessoa certa no momento certo é mais importante do que nunca”, afirma uma propaganda da Cambridge Analytica sobre marketing eleitoral. Caso tenha interesse nesse caso, a Netflix produziu um documentário chamado Privacidade Hackeada muito interessante em 2019. Fica aqui a nossa recomendação para você unir o útil (entender mais sobre o assunto) ao agradável (assistir a um filme antes de dormir).

Para entender melhor onde a ética se encaixa nesses casos, vamos dividir a análise de dados em etapas e mencionar onde a ética se encaixa em cada uma delas. Após isso, você pode refletir sobre o que poderia ser feito para evitar essas catástrofes.

Podemos difundir a análise de dados em três etapas: (1) coleta, (2) armazenamento e compartilhamento e, é claro, (3) a parte de análise propriamente dita. Vamos falar um pouco de cada uma.

A coleta dos dados é o primeiro passo para se obter qualquer informação. Esses dados podem ser coletados de diversas formas, como arquivos físicos, dados públicos, dados de mídias sociais etc. Nessa etapa é muito importante ter a ciência da necessidade (e do direito) à privacidade e ao sigilo dos dados para que seja garantida a proteção de seus dados pessoais. A falta da ética nessa etapa pode gerar não só os problemas mencionados acima (inexistência da privacidade de sigilo dos dados) como também a manipulação e obtenção de falsas análises. Um profissional que não faz o uso da ética poderia facilmente manipular os resultados já no primeiro estágio da pesquisa. Uma coleta de dados mal feita, seja propositalmente ou não, pode trazer resultados controversos.

“Não é necessário que os resultados de uma pesquisa sejam manipulados – ou seja, que eles sejam deliberadamente alterados com o objetivo de criar uma impressão falsa – pois um simples e intencional direcionamento durante a seleção da amostra manipulará o resultado da pesquisa automaticamente.”

– Darrel Huff.

Agora vamos falar uma pouco sobre o armazenamento e compartilhamento dos dados. Um desafio encontrado, principalmente quando se trata de um grande volume, é poder armazená-los de uma maneira que supra as necessidades de consultas e análises após o armazenamento, ou seja, os dados não podem ser armazenados de qualquer forma. Existem diversas ferramentas (principalmente de armazenamento em nuvem) e formatos para o armazenamento de dados hoje, fazendo com que existam várias soluções para contornar problemáticas inerentes. E onde está a ética nesse contexto? Sendo direto: na segurança do armazenamento desses dados. Ataques de hackers às bases de dados de empresas, por exemplo, são extremamente comuns (como o exemplo da Netshoes), e dificilmente deixarão de existir. Para contornar isso, ações do ponto de vista ético precisam andar lado a lado com o armazenamento de dados para minimizar as falhas existentes. Como exemplos, adotar medidas como coletar e armazenar dados pessoais somente mediante autorização explícita dada pelo usuário, avisar imediatamente aos proprietários dos dados pessoais caso aconteça alguma vazamento, avisar de forma clara ao usuário caso a finalidade de uso dos dados tenha sido alterada, entre outras. Quando se trata do compartilhamento de dados, a mesma ética utilizada na parte da coleta e do armazenamento pode e deve ser usada. Compartilhar informações de uma entidade para outra pode ser uma tarefa tão fácil a ponto de parecer inofensiva, porém a esse processo se aplicam todos os princípios éticos mencionados acima.

Por último, o foco deste post, a análise dos dados. A etapa de análise, como dito inicialmente, visa manipular e transformar todo aquele dado coletado e armazenado em informações relevantes para o contexto inserido. Essa etapa exige um conhecimento minimamente básico sobre o conjunto de dados, Estatística, público-alvo e o contexto geral para a qual a informação será gerada. Erros propositais ou não podem gerar catástrofes na apresentação dos resultados. Essa talvez seja a etapa onde a ética é mais importante. É relativamente “fácil” omitir ou transmitir informações erradas. O livro “Como mentir com estatística”, escrito por Darrel Huff (referenciado anteriormente), trata muito bem desse assunto e é uma leitura indispensável no ramo de análise de dados. A falta de profissionais verdadeiramente capacitados em analisar dados, como estatísticos, por exemplo, abre brechas para as empresas contratarem pessoas de diferentes áreas para realizar esse serviço, o que pode vir a ser um problema. O problema não se limita somente em análises “erradas”, mas também em análises precisas, como foi o exemplo da Cambridge Analytica, em que foram capazes de manipular os resultados de eleições utilizando análise de dados. A manipulação de comportamento, previsão de comportamento e coisas do tipo tornou-se comum atualmente, sendo facilmente percebido em anúncios nas redes sociais. Ora, vai me dizer que nunca apareceu em sua rede social um anúncio e imaginou que o seu celular estava te escutando? Isso é “apenas” o seu comportamento sendo precisamente previsto. Poderíamos ficar o dia todo falando sobre as possibilidades e a diversidade da análise de dados, mas voltando ao foco, onde cabe a ética nesse caso? Talvez a parte mais importante e já mencionada acima é a privacidade do indivíduo. Quando uma base de dados for disponibilizada para análise é essencial que os dados sejam anonimizado, ou seja, que não cosigamos indentificar de fato quem é aquela pessoa.

Bom, outras coisas valem a discussão, mas acredito que nessa etapa do post você já tenha desenvolvido conhecimento e senso crítico o suficiente para tirar suas próprias conclusões sobre ética na análise de dados. Sendo assim, propomos um desafio a você: mentalize os acontecimentos citados acima e pense na ética, em ações que tomaria de diferente. Como sugestão, talvez a definição do Cortella sobre as três perguntas que usamos no começo do post seja uma bom caminho a ser seguido.

“O espírito humano precisa prevalecer sobre a tecnologia.”

–  Albert Einstein.

Compartilhe se gostou! Mas se tem sugestões, comentários e/ou dúvidas, escreva-nos em observatorioobstetricobr@gmail ou nas nossas redes, Twitter ou Instagram.