Pesquisar este blog

domingo, 24 de dezembro de 2017

Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are

     Ever since philosophers speculated about a "cerebroscope," a mythical device that would display a person's thoughts on a screen, social scientists have been looking for tools to expose the workings of human nature. During my career as a experimental psychologist, different ones have gone in and out of fashion, and I've tried them all - rating scales, reaction times, pupil dilation, function neuroimaging, even epilepsy patients with implanted electrodes who were happy to while away the hours in a language experiment while waiting for a seizure.
     Yet none of these methods provides an unobstructed view into the mind. The problem is a savage trade off. Human thoughts are complex propositions; unlike Wood Allen speed-reading
War and Peace, we don't just think "It was about some Russians." But propositions in all their tangled multidimensional glory are difficult for a scientist to analyze.

SPOILER FREE

Esse é um livro que foi lançado agora em 2017, o que é uma raridade para mim, quer dizer, é raro eu ler um livro ainda no seu ano de lançamento, por motivos de muitos e muitos e muitos livros para ler. Mas esse pulou a fila por conta do seu tema, estatísticas de internet sendo utilizadas para estudar a natureza humana.

Como não se interessar em como se pode determinar em quais lugares as pessoas são realmente racistas sem precisar fazer pesquisas de opinião, em que ninguém em sã consciência irá dizer abertamente que sim, é uma pessoa racista? Ok, existem exceções, mas a pesquisa nunca vai ter um resultado muito exato.

Todo o trabalho de Davidowitz começou a fazer sucesso no meio acadêmico quando ele produziu um mapa de estatísticas de racismo nos EUA, que ele na verdade tinha desenvolvido para tentar entender as eleições ganhas pelo Barack Obama, mas que previram melhor que todos os modelos dos grandes pesquisadores eleitorais a vitória (não prevista por ninguém de fama da área) do atual presidente americano Trump, com direito a acertar quase todos os locais onde ele venceu.

Simplesmente irresistível, né? Com a questão de ser um campo novo, ainda em desenvolvimento, o que quer dizer que em 5 anos provavelmente esse livro já vai estar bastante ultrapassado nessa área.

Questões do porquê eu escolhi ler logo o livro e questões técnicas à parte, o livro é muito divertido. O autor consegue tornar a leitura simplesmente leve, com inúmeras anedotas muito engraçadas. O trade-off disso é, claro, ele não fala muito sobre os aspectos técnicos de como se faz estudos com big-data (que são bancos de dados gigantes), ou exatamente que modelos ele utilizou para fazer os trabalhos que ele apresenta nesse livro.

Mas tudo bem, não era exatamente o objetivo desse livro em específico, para isso você teria que ver um livro técnico de estatística. Nesse livro, Davidowitz quer fazer uma explicação do porque usar big-data, quando funciona, quando não faz diferença, e abrir os olhos da galera para um novo campo de pesquisa e coleta de dados: a internet. (Isso foi antes de acabaram com a neutralidade da rede, o que é outro assunto, mas, eu não podia deixar de mencionar e apontar minha tristeza e perda de parte da minha esperança na humanidade com isso - pesquisem sobre esse assunto, afeta a todos que usam a internet)

E não, você não precisa entender nada de estatística ou base de dados para ler esse livro e se divertir. Pontos extras!

Nota 10!

Um comentário:

  1. Sempre dá para buscar o paper do cara e ler mais tarde, se quiser se aprofundar. A boa notícia é que a lei de Moore acabou de morrer, e os computadores de amanhã (ou de 10 anos a frente) não serão mais exponencialmente melhores que os atuais. Esqueça os perigos da singularidade, super IAs, ou super análises de Big Data. A não ser que nego invente o computador quântico "prático", ai ferrou tudo, a começar pela criptografia.

    ResponderExcluir

Deixe sua opinião/crítica/comentário: