5 de novembro de 2019

O PODER DO BIG DATA



Palavras são dados. Cliques são dados. Links são dados. Erros de digitação são dados. Bananas em sonhos são dados. O tom de voz é um dado. Assobios na respiração são dados. Ritmo cardíaco é dado. Tamanho do baço é dado. As buscas são, é o que defendo, os dados mais reveladores. (...) Os dados de busca do Google são de longe a fonte predominante de Big Data. (...) O sucesso do Google é também construído sobre a coleta de um novo tipo de dados. (...) A revolução do Big Data tem menos relação com coletar cada vez mais dados e mais com coletar os dados certos. (...) Oferecer novos tipos de dados é o primeiro poder do Big Data. (...) Nos permite finalmente ver o que as pessoas realmente querem e realmente fazem, não o que dizem que querem e que fazem. Oferecer dados honestos é o segundo poder do Big Data. (...) Permitir a análise de pequenos subconjuntos de pessoas é o terceiro poder. (...) Permite uma diferenciação significativa em pequenos segmentos de um conjunto de dados para obter novas perspectivas sobre quem somos. E podemos analisar de perto outras dimensões além da idade. Se tivermos dados suficientes, podemos ver como as pessoas em determinadas cidades e bairros se comportam. E podemos descobrir como as pessoas se comportam mal hora a hora ou até minuto a minuto. (...) Permitir a realização de muitos experimentos causais é o quarto poder do Big Data. (...) É aqui que a grandiosidade do Big Data realmente entra em cena. Você precisa de muitos píxeis em uma foto para ser capaz de a ampliar com nitidez em determinado ponto. Da mesma forma, são necessárias muitas observações em um conjunto de dados para possibilitar a identificação clara de um pequeno subconjunto daqueles dados - por exemplo, qual é a popularidade do Mets entre homens nascidos em 1978. Uma pequena pesquisa de alguns milhares de pessoas não terá uma amostra grande o suficiente desses homens. (...) “Big Data não quer dizer fazer apenas a mesma coisa que você faria com a pesquisa, exceto pela utilização de mais dados”, explica Chetty. Eles estavam fazendo perguntas mais apropriadas para poucos dados para a gigantesca coleção de dados que tinham em mãos. “Big Data deveria na verdade permitir a utilização de arranjos totalmente diferentes daqueles usados na pesquisa comum”, explica Chetty.

Seth Stephens-Davidowitz (Todo Mundo Mente; págs: 53, 54, 60, 62, 97, 169, 170 e 171)

Nenhum comentário: