
Linguagem R
26/01/2022
Resenha de Livro
Ao longo da história, vários autores escreveram sobre a ética e a sua visão sobre esse assunto, que é de extrema importância em quase tudo que fazemos. Para este post, resolvemos trazer uma frase dita pelo filósofo brasileiro Mario Sérgio Cortella que nos ajudará a refletir sobre o tema.
“Ética é o conjunto de valores e princípios que usamos para responder a três grandes questões da vida: (1) quero?; (2) devo?; (3) posso? Nem tudo que eu quero eu posso; nem tudo que eu posso eu devo; e nem tudo que eu devo eu quero. Você tem paz de espírito quando aquilo que você quer é ao mesmo tempo o que você pode e o que você deve.”
Você pode pensar nessa definição como referência toda vez que tratarmos de ética ao longo do texto.
Bom, podemos dizer de uma forma bem direta que analisar dados é transformar dados em informação. Dados brutos são gerados a todo momento de diferentes maneiras. Basicamente toda ação realizada pelo ser humano é capaz de gerar dados hoje em dia. E por que é necessário analisar esses dados? Os dados em sua forma bruta dificilmente será capaz de transmitir informações em geral.
Por exemplo, imagine que você resolveu pesquisar informações sobre casos de gestantes e puérperas notificados com Síndrome Respiratória Aguda Grave (SRAG), e a única coisa que encontra é a base SIVEP Gripe (Sistema de Informação da Vigilância Epidemiológica da Gripe) disponibilizada pelo Ministério da Saúde. Você seria capaz de olhar aquela gigantesca base de dados e extrair as informações que deseja? Dificilmente. Por isso, a análise de dados se faz necessária, pois a partir dela é que são geradas informações capazes de responder a perguntas e questionamentos levantados necessários para a tomada de uma decisão.
Vamos adentrar um pouco mais nesse assunto ao longo do post. Ah, e caso tenha tido interesse em se atualizar sobre casos de gestantes e puérperas notificados com SRAG, nós temos um painel interativo com diversas análises e informações já prontas (não precisa tentar tirar informações dos dados brutos, por exemplo, rs). Você pode acessá-lo clicando aqui.
Apesar de ética e análise de dados parecerem duas coisas sem conexão alguma, diversos problemas podem acontecer quando a análise de dados é feita sem ética. Sabemos que toda profissão tem o seu código de ética, mas já imaginou se alguma delas não tivesse? O que aconteceria com a Medicina? O médico poderia focar apenas em seus lucros, cobrar valores exorbitantes para problemas simples, pessoas sem qualificação poderiam realizar cirurgias, produtos que causam danos à saúde poderiam ser facilmente encontrados, entre outros problemas. O mesmo caos poderíamos pensar a respeito do Direito, da Psicologia, da Engenharia Civil… e por que não na análise de dados. Sobre esse último é o que tentaremos explicar neste post.
Para começar, vamos dar exemplos de dois casos famosos que envolveram dados.
Em 2018, o Ministério Público constatou o vazamento de dados pessoais do site de comércio eletrônico Netshoes de mais de 2 milhões de pessoas. Foram vazados dados como nome, CPF, e-mail, data de nascimento, histórico de compras, entre outros. Devido à ausência de uma lei voltada para a proteção de dados pessoais, a empresa só deu início ao processo de comunicar seus clientes a respeito do vazamento após um período de mais de três meses do acontecido, deixando, portanto, as vítimas sem qualquer conhecimento do problema que lhes cabiam.
Outro caso a ser mencionado é o escândalo da Cambridge Analytica que envolveu o Facebook. Para resumir, a empresa utilizou um aplicativo para coletar informações de mais de 80 milhões de usuários do Facebook sem seu conhecimento. A coleta de dados começou em 2014 envolvendo usuários que quiseram participar do teste promovido por meio do aplicativo. O grande problema foi que, ao concordarem em participar dos testes, as pessoas estavam entregando, sem saber, não só as suas informações privadas, mas também a de todos os seus amigos. Esses dados incluíam detalhes sobre nome, identidade, moradia, gostos e hábitos etc. A empresa Cambridge Analytica utilizou esses dados para traçar perfis psicológicos dos usuários, e com essas informações influenciar diversas eleições por meio de propaganda política direcionada. “Fornecer a informação certa à pessoa certa no momento certo é mais importante do que nunca”, afirma uma propaganda da Cambridge Analytica sobre marketing eleitoral. Caso tenha interesse nesse caso, a Netflix produziu um documentário chamado Privacidade Hackeada muito interessante em 2019. Fica aqui a nossa recomendação para você unir o útil (entender mais sobre o assunto) ao agradável (assistir a um filme antes de dormir).
Para entender melhor onde a ética se encaixa nesses casos, vamos dividir a análise de dados em etapas e mencionar onde a ética se encaixa em cada uma delas. Após isso, você pode refletir sobre o que poderia ser feito para evitar essas catástrofes.
Podemos difundir a análise de dados em três etapas: (1) coleta, (2) armazenamento e compartilhamento e, é claro, (3) a parte de análise propriamente dita. Vamos falar um pouco de cada uma.
A coleta dos dados é o primeiro passo para se obter qualquer informação. Esses dados podem ser coletados de diversas formas, como arquivos físicos, dados públicos, dados de mídias sociais etc. Nessa etapa é muito importante ter a ciência da necessidade (e do direito) à privacidade e ao sigilo dos dados para que seja garantida a proteção de seus dados pessoais. A falta da ética nessa etapa pode gerar não só os problemas mencionados acima (inexistência da privacidade de sigilo dos dados) como também a manipulação e obtenção de falsas análises. Um profissional que não faz o uso da ética poderia facilmente manipular os resultados já no primeiro estágio da pesquisa. Uma coleta de dados mal feita, seja propositalmente ou não, pode trazer resultados controversos.
“Não é necessário que os resultados de uma pesquisa sejam manipulados – ou seja, que eles sejam deliberadamente alterados com o objetivo de criar uma impressão falsa – pois um simples e intencional direcionamento durante a seleção da amostra manipulará o resultado da pesquisa automaticamente.”
– Darrel Huff.
Agora vamos falar uma pouco sobre o armazenamento e compartilhamento dos dados. Um desafio encontrado, principalmente quando se trata de um grande volume, é poder armazená-los de uma maneira que supra as necessidades de consultas e análises após o armazenamento, ou seja, os dados não podem ser armazenados de qualquer forma. Existem diversas ferramentas (principalmente de armazenamento em nuvem) e formatos para o armazenamento de dados hoje, fazendo com que existam várias soluções para contornar problemáticas inerentes. E onde está a ética nesse contexto? Sendo direto: na segurança do armazenamento desses dados. Ataques de hackers às bases de dados de empresas, por exemplo, são extremamente comuns (como o exemplo da Netshoes), e dificilmente deixarão de existir. Para contornar isso, ações do ponto de vista ético precisam andar lado a lado com o armazenamento de dados para minimizar as falhas existentes. Como exemplos, adotar medidas como coletar e armazenar dados pessoais somente mediante autorização explícita dada pelo usuário, avisar imediatamente aos proprietários dos dados pessoais caso aconteça alguma vazamento, avisar de forma clara ao usuário caso a finalidade de uso dos dados tenha sido alterada, entre outras. Quando se trata do compartilhamento de dados, a mesma ética utilizada na parte da coleta e do armazenamento pode e deve ser usada. Compartilhar informações de uma entidade para outra pode ser uma tarefa tão fácil a ponto de parecer inofensiva, porém a esse processo se aplicam todos os princípios éticos mencionados acima.
Por último, o foco deste post, a análise dos dados. A etapa de análise, como dito inicialmente, visa manipular e transformar todo aquele dado coletado e armazenado em informações relevantes para o contexto inserido. Essa etapa exige um conhecimento minimamente básico sobre o conjunto de dados, Estatística, público-alvo e o contexto geral para a qual a informação será gerada. Erros propositais ou não podem gerar catástrofes na apresentação dos resultados. Essa talvez seja a etapa onde a ética é mais importante. É relativamente “fácil” omitir ou transmitir informações erradas. O livro “Como mentir com estatística”, escrito por Darrel Huff (referenciado anteriormente), trata muito bem desse assunto e é uma leitura indispensável no ramo de análise de dados. A falta de profissionais verdadeiramente capacitados em analisar dados, como estatísticos, por exemplo, abre brechas para as empresas contratarem pessoas de diferentes áreas para realizar esse serviço, o que pode vir a ser um problema. O problema não se limita somente em análises “erradas”, mas também em análises precisas, como foi o exemplo da Cambridge Analytica, em que foram capazes de manipular os resultados de eleições utilizando análise de dados. A manipulação de comportamento, previsão de comportamento e coisas do tipo tornou-se comum atualmente, sendo facilmente percebido em anúncios nas redes sociais. Ora, vai me dizer que nunca apareceu em sua rede social um anúncio e imaginou que o seu celular estava te escutando? Isso é “apenas” o seu comportamento sendo precisamente previsto. Poderíamos ficar o dia todo falando sobre as possibilidades e a diversidade da análise de dados, mas voltando ao foco, onde cabe a ética nesse caso? Talvez a parte mais importante e já mencionada acima é a privacidade do indivíduo. Quando uma base de dados for disponibilizada para análise é essencial que os dados sejam anonimizado, ou seja, que não cosigamos indentificar de fato quem é aquela pessoa.
Bom, outras coisas valem a discussão, mas acredito que nessa etapa do post você já tenha desenvolvido conhecimento e senso crítico o suficiente para tirar suas próprias conclusões sobre ética na análise de dados. Sendo assim, propomos um desafio a você: mentalize os acontecimentos citados acima e pense na ética, em ações que tomaria de diferente. Como sugestão, talvez a definição do Cortella sobre as três perguntas que usamos no começo do post seja uma bom caminho a ser seguido.