Big data: parte 1 18/02/2020 - 09:50
O último estudo desenvolvido pela IBM em 2012, revelava que cerca de 2,5 quintilhões de bytes de dados eram produzidos diariamente. As estimativas apontavam para um 2018 expressivo: 50 mil gigabytes de dados produzidos por segundo no mundo. Agora, no ano de 2020, provavelmente, esses números explodiram. O relatório “Digital in 2020” realizado pela We Are Social e Hootsuite mostra um cenário digital no Brasil com 150.4 milhões de usuários na internet ou 71% da população.
E o que esses números tem a ver com big data?
Na verdade, tudo. Roger Magoulas foi quem apresentou ao mundo o conceito de big data pela primeira vez em 2005. No entanto, o termo sofreu diversas alterações e a definição mais completa e ampla foi proposta pela Gartner: “big data são ativos de informação de grande volume, alta velocidade e alta variedade que exigem formas inovadoras e eficientes de processamento de informações para visualização e tomada de decisões aprimoradas”.
Trazendo para a administração pública, o big data aprimora a comunicação entre os entes públicos e e a população, o que facilita o entendimento da demanda da sociedade e torna o cidadão ponto central na tomada de decisão. Por conseguinte, o uso de dados proporciona a criação e melhora de serviços públicos e eleva o grau de eficiência, eficácia e transparência do setor público.
Os 3V`s do big data
Volume, variedade e velocidade popularmente conhecidos como 3V`s são dimensões ou características que delimitam o big data. O termo - introduzido por Doug Laney em 2001 - também sofreu mudanças ao passar dos anos, porém, os 3`Vs a seguir continuam sendo os essenciais:
Volume
O primeiro “V” refere-se a quantidade de dados criados de diversas fontes. Isso inclui: o texto, o áudio, a foto, o vídeo, o relatório médico, a previsão do tempo, a transação bancária, a quantidade de usuários do transporte público, o índice de criminalidade e muitas outras infinidades de dados.
Variedade
O big data é composto por vários formatos: áudio, texto, vídeo, imagem, gráfico, sensores, etc. Diante desse imenso acervo digital, há dados que não se encaixam em um meta-modelo (conjunto de regras para enquadrar um conceito ou ideia) assumindo a forma de um dado não estruturado. Estes dados não seguem regras, ao contrário dos dados estruturados facilmente armazenados em tabelas e inseridos dentro de um rol de normas bem definidas. Assim, o big data atua para dar sentido aos dados desestruturados.
Velocidade
O volume de dados produzidos é gigantesco. O objetivo do último “V” é processar essa imensa grandeza em um tempo útil. Pois, os dados necessitam ser tratados dentro do tempo a fim de que os resultados obtidos sejam relevantes.
No próximo artigo, você ficará sabendo se o uso de big data é vantajoso ao serviço público.