BLOG

O que é Big Data?

Origem: Everybody Lies – big Data, new data, and what the Internet can tell us about who we really are. Seth Stephens. Harper Collins, 2017. (tradução do portal).

Peço-lhes permissão para colocar em foco um assunto delicado: o que é Big Data, sua real aplicabilidade aos assuntos de negócio e a crescente digitalização de toda a atividade humana. Nas palavras de Seth Stephens, “How big is big?” O autor trabalhou como cientista de dados na Google e é PhD em economia por Harvard.

Seth reflete sobre a incalculável quantidade de informações armazenadas sobre pesquisas no Google Search e sua aplicabilidade. Em síntese, observa que os temas de pesquisas, consideradas em conjunto, refletem mais sobre o comportamento humano que qualquer pesquisa sócio-econômica séria e bem conduzida. A chave disso é que as pessoas contam mais em seus questionamentos no Google do que elas mesmas poderia identificar em seus padrões de comportamento ou sobre seu auto-conhecimento.

Se nós agregarmos toda essa informação, mantendo tudo de forma anônima, nos certificando de que nunca saberemos sobre os medos, desejos e comportamento de qualquer indivíduo específico, e adicionarmos a essas informações ciência de dados, começaremos a ter uma nova visão dos seres humanos, sobre sua natureza.

Há duas abordagens convergentes no livro: primeiro, procura evidenciar o grau de acuracidade dos dados de pesquisa no Google Search sobre fenômenos conhecidos, tentando dar alguma previsibilidade a eles, a exemplo das eleições americanas recentes, associando seu resultado ao racismo da sociedade americana; depois, procura vislumbrar alguma aplicabilidade do uso dessas informações para assuntos relevantes no mundo atual.

Em relação à questão do uso dessas informações, atenho-me sobre o nível de previsibilidade sobre um determinado comportamento de consumidor, assunto muito discutido e trabalhado nesses tempos de abordagens centradas no comportamento humano. Por exemplo, até que ponto a utilização de testes A/B como experimentos práticos poderiam ser substituídos pelos dados consolidados de comportamento obtidos na Web?

Em uma avaliação minha, o uso desse tipo de agregação é válida quando a quantidade de informações analisadas é gigantesca (realmente BIG!), até pelo viés estatístico que podem embutir. Quando começo a restringí-las à localização, mercados específicos, carecem de tratamento adequado e perdem seu efeito prático.

Por enquanto valem algumas tendências mais gerais de comportamento a exemplo da correlação existente entre a ansiedade e a neurose urbana, colocadas em dúvida pelo estudo.

Fonte: Resenha Startup

Compartilhe nas Redes Sociais

Outros Artigos

Nuvem

CE | RN | PE | SE | BA | MG | SP - Telefone: (85) 3119.5969

Golden Technologia © 2018 - Todos os direitos reservados.
Termos de Uso | Política de Privacidade

Nunan