Antes de comenzar cito una frase del Director de IoT y Transformación Digital en Cisco España, para entender la magnitud de valor que posee el Big Data:
“Los datos son ‘el nuevo petróleo’, se están convirtiendo en pieza clave de la sociedad y la economía”.
Antonio Conde. Director de IoT y Transformación Digital en Cisco España
Hoy en día el término Big Data se escucha por todos lados cuando se hablan temas de explotación de los datos e inteligencia artificial. En este post, describiremos el alcance del Big data y una breve historia para en los siguientes post adentrarnos en mostrarte casos prácticos.
Concepto
Big Data es describe un gran volumen de datos, que pueden provenir de distintas fuentes como archivos de excel, estadísticas de sitios web, de Facebook ads, google ads, conversaciones de WhatsApp, videos de cámaras de vigilancia, correos electrónicos, o datos demográficos provistos por el gobierno. ¿Imaginas ordenar todo eso? Estos datos pueden clasificarse como estructurados y no estructurados. Se prevé que para 2025 existan 175 zetabytes de información en el mundo.
Datos estructurados
Son los que como tú como humano puedes leer fácil y ordenadamente como una hoja de excel con filas y columnas.
Ejemplos:
Lista de tus clientes con los campos nombre, teléfono, email.
Resultados de una encuesta de opción múltiple.
Registros de un formulario web con nombre, edad, estatura.
Datos no estructurados
Son datos que no fácilmente podrías decir a donde pertenecen porque no tienen una estructura definida y pueden tener características no cuantificables.
Ejemplos:
Un video cualquiera.
Un audio cualquiera.
El texto de un sitio web.
Las fotos de la galería de tu teléfono.
Las 5 “V”
Las características que definen a un conjunto de datos Big data son:
- Volumen: Probablemente la característica más asociada ya que indica que existe una gran cantidad de datos.
- Velocidad: Debe estar disponible para almacenar y consultar ya que puede ser que los datos tengan un tiempo de vida corto y sean sustituidos por información nueva incluso en segundos.
- Variedad: Proviene de distintas fuentes y aquí reside la riqueza de posibilidades que nos otorga el acceso a esta información.
- Veracidad: Es la confianza que pueden otorgar los datos en conjunto aunque es difícil de medir por el volumen de datos.
- Valor: Aparte de verídicos, los datos deben aportar valor a las incógnitas del negocio.
Tamaño
No está oficialmente definido, pero en la práctica, podrían rondar desde los 30 terabytes hasta varios petabytes.
Historia breve del big data
El “big data” es relativamente nuevo pero los orígenes de los grandes conjuntos de datos se encuentran en las décadas de 1960 y 1970, cuando se iniciaba con los primeros centros de datos y el desarrollo de las bases de datos estructuradas.
Fue en al inicio del crecimiento y popularización de las redes sociales que la gente empezó a darse cuenta de la cantidad de datos que generaban los usuarios a través de Facebook, YouTube y otros servicios online. En 2005, se desarrollaría Hadoop, un entorno creado para almacenar y analizar grandes conjuntos de datos.
El desarrollo de nuevas plataformas para el almacenamiento de datos no se ha detenido desde entonces y constantemente se liberan nuevas versiones de productos que abaratan los costos de almacenamiento. Hoy es posible encontrar una solución acorde a los datos que deseamos almacenar.
¿Por qué el Big Data es tan importante?
Porque responde preguntas que muchas veces las organizaciones no sabían que tenían, siempre y cuando se mezclen los correctos perfiles profesionales para la limpieza y explotación de datos con los analistas y expertos en el negocio.
El análisis de Big Data ayuda a las organizaciones a aprovechar sus datos y utilizarlos para identificar nuevas oportunidades. Eso, a su vez, conduce a movimientos de negocios más inteligentes, operaciones más eficientes, mayores ganancias y clientes más felices. Las empresas con más éxito con Big Data consiguen valor de las siguientes formas:
Reducción de costes. El análisis de los datos permite reducir costes de fabricación de productos y ejecución de servicios. Además una infraestructura en la nube, reduce el costo contra la adquisición de clústers para el análisis.
Rapidez y certeza en decisiones. La velocidad y la capacidad de analizar distintas fuentes de datos permiten girar en otra dirección a las empresas inmediatamente y tomar decisiones basadas en lo que han aprendido.
Nuevos productos y servicios. Cuando somos capaces de medir las necesidades de los clientes y su satisfacción a través de análisis, viene el poder de dar a los clientes lo que quieren. Con Big data, esto es una realidad.
Usos del Big Data en el 2020
Opportunity Insights Economic Tracker es una plataforma gratuita en Estados Unidos, que proporciona datos actualizados de empresas y organizaciones privadas sobre el gasto de los consumidores, la actividad de las pequeñas empresas y las ofertas de empleo.
Más información click aquí:
https://opportunityinsights.org/updates/economic-tracker/
Un proyecto coordinado por Alberto Cavallo y Roberto Rigobón de la Universidad de Harvard y el Instituto Tecnológico de Massachusetts (MIT), hace un seguimiento de la inflación recogiendo datos de vendedores por internet.
Más información click aquí:
https://www.hbs.edu/faculty/Pages/item.aspx?num=52242
Otra iniciativa del MIT y de la empresa Endor utiliza los datos de localización de la telefonía móvil para rastrear el número de visitantes de distintas localidad a los hospitales y con eso predecir en donde es probable que tengan un aumento en el número de hospitalizaciones por COVID-19 durante las dos semanas siguientes.
Más información click aquí:
https://connection.mit.edu/sites/default/files/publication-pdfs/Covid19-Prediction-5-10-20_0.pdf
Un portal interactivo utiliza datos de teléfonos celulares para revelar la movilidad en 22 países de América Latina y el Caribe, arrojando así luz sobre la eficacia de las medidas de confinamiento establecidas por los gobiernos.
Más información click aquí:
https://www.iadb.org/es/investigacion-y-datos/movilidad-covid
Otro uso de los datos de teléfonos celulares es para mostrar de qué manera las declaraciones públicas de los líderes políticos influyen en la movilidad de las poblaciones.
Más información click aquí:
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3582908
Este NO es un post futurista, es del HOY.
¿Vives en el pasado o ya estás implementando esto en tu organización? Déjame saber tus comentarios.
🏆Consultor en Transformación Digital e Inteligencia Artificial desarrollando proyectos en organizaciones del Gobierno Mexicano como SAT, IMSS, CFE y en el sector privado para empresas internacionales como DHL, Santillana, citiBanamex, HSBC, Softtek y Grupo Salinas.
👨🚀 Podcast: Big Data para Negocios
⭕️CoOrganizer @tedxpolanco
1 comentario en «¿Qué es el Big data? Su importancia y usos en el COVID y 2020»