A cada dois ou três anos surgem no mundo da tecnologia algumas palavras da moda, geralmente soluções que todos afirmam que irão revolucionar o mundo, transformar a sociedade, mudar a forma como trabalhamos ou qualquer coisa do gênero. Atualmente este termo é Big Data. Como qualquer assunto que recebe muita publicidade, existe uma confusão sobre o conceito, muitas vezes distorcido por empresas que querem se aproveitar desta exposição. É comum ver pessoas dizendo que gostariam de fazer Big Data sem terem a menor ideia do que estão falando. Por conta disso, esclarecemos do que se trata para impedir que empresas desonestas continuem vendendo ilusões.

O Conceito de Big Data
Primeiro, é importante definir o que não é Big Data. O termo não se refere a uma tecnologia, ferramenta, software, aplicativo ou qualquer coisa dessa natureza. Big Data é algo concreto, como mesa, cadeira ou computador. A definição formal fala de um conjunto de dados que possui as seguintes características: volume, variedade, velocidade e veracidade (os quatro V’s do Big Data).

Por volume entende-se a quantidade de dados, geralmente conjuntos que possuam alguns terabytes. Variedade tem a ver com os diferentes formatos e estruturas deste conjunto de informações (um grupo em que todos os dados estão no mesmo formato simples não se caracteriza variedade). Velocidade representa o quão rápido a informação muda ou os novos pontos de informação aparecem, o que impacta diretamente o tempo disponível para processamento. Por fim, a Veracidade está relacionada com a qualidade dos dados, ou seja, se estão corretos ou não.

Gosto de pensar em um quinto “V”, o Valor. Mesmo que os dados tenham os quatro atributos citados acima, eles não irão trazer resultados para a empresa se não tiverem relevância. Ao mesmo tempo, olhando de forma diferente para conjuntos antigos, é possível chegar a características de valor que podem levar a outros “V’s”.

Portanto, é impossível “fazer um Big Data”. Podemos resolver problemas que envolvem o conceito, mas não existe valor nem benefícios para uma empresa em simplesmente “fazer Big Data”. Uma vez que você tenha um conjunto de dados que se caracteriza nesta definição, é possível aplicar uma série de ferramentas para manipular e tratar esse grupo, como Hadoop, No-SQL, Base Colunar, Map Reduce, entre outros.

Evitando a confusão
Infelizmente, criar confusão e incertezas ao redor de novas tecnologias é uma prática comum na área de TI. Muitas empresas sobrevivem essencialmente de rotular seus produtos antigos com as palavras da moda, fazendo parecer que estão no topo da evolução tecnológica quando, na verdade, suas soluções funcionam de forma igual frente aos novos desafios.

Os problemas relacionados com Big Data são diferentes e novas tecnologias são, de fato, necessárias para resolvê-los. Como sempre, se informar é a melhor maneira de evitar a confusão. Entenda o conceito explicado acima e avalie se o problema que deve ser resolvido se enquadra nas características mencionadas. Ao mesmo tempo, avalie se o discurso de uma empresa está alinhado com os elementos relacionados com Big Data. Assim, evitará comprar soluções que só tem a roupagem da moda, mas sem nenhum conteúdo.

Thoran Rodrigues é CEO da BigData Corp

Leia mais

A crise econômica e o Big Data

Como as concessionárias de energias podem aplicar o Big Data?

Top 6 Big Data: o que fazer e não fazer