Aunque hoy en día la implementación de proyectos Big Data solo la llevan cabo las grandes organizaciones, creo que las demás organizaciones también se podrían beneficiar. Actualmente es mucho más fácil disponer de ambientes en Cloud, de encontrar soluciones Open Source o incluso hardware de bajo costo que les permita potencializarse, es por eso que he recolectado los casos de uso hadoop más llamativos con los que podrías darte una idea.
Anteriormente vimos la introducción a Hadoop donde podías adquirir una visión general de cómo funciona, sus componentes y sus principales proyectos. Hoy quiero mostrarte que aunque cuando hablamos de Big Data nos referimos a grandes cantidades de datos, podremos sacar provecho de su tecnología y potenciarnos.
Es posible que hayas escuchado que uno de los usos más llamativos del Big Data actualmente viene de la mano del Marketing Digital, y es que estamos en el punto donde las organizaciones pueden analizar a sus consumidores (o leads) individualmente de manera que sea posible realizar promociones o campañas mucho más directas, menos costosas y menos intrusivas minimizando los famosos SPAM brindando una gran ventaja para todos nosotros.
Más aún con el auge de la Ciencia de los Datos donde no importa el tamaño o sector de la organización será necesario disponer de grandes volúmenes de datos listos para consumir y analizar.
Recuerda que no todas las organizaciones necesitan de Big Data, pero independientemente de su tamaño y sector, si necesitarán trabajar con grandes cantidades de datos.
Casos de uso prácticos de Hadoop
1. Construir una visión comprensiva del cliente
Hoy en día las organizaciones de todos los tamaños interactúan por distintos canales con sus clientes (redes sociales, newsletters , en sus tiendas, visitas personalizadas, etc), pero el comportamiento del cliente es casi totalmente impredecible sin Hadoop. Hadoop es capaz de almacenar y correlacionar los datos de las transacciones y el comportamiento de navegación en línea, lo que permite identificar las fases del ciclo de vida del cliente para aumentar las ventas, reducir los gastos de inventario y crear una base de clientes leal.
2. Acciones en tiempo real para la toma de decisiones
Cada vez son más las organizaciones se ven con la necesidad de identificar oportunidades en tiempo real, identificar picos que alerten riesgos en sus marcas o incluso los clientes insatisfechos por algún servicio o producto. Con esta premisa además podríamos realizar por ejemplo control de fraudes, control de disponibilidad, entender el comportamiento del cliente, premiarlo con incentivos, identificar problemas de seguridad mediante sensores, etc.
Hadoop posee un gran proyecto llamado Spark (Que también puede ser implementado sin necesidad de Hadoop) donde puedes implementar procesos de análisis en tiempo real vía streaming.
3. Optimizar sitios web o Clickstreams
Los datos de Clickstream son una parte importante del gran marketing de datos: le dice a las organizaciones qué clientes hacen clic y compran (o no compran). Sin embargo, el almacenamiento para ver y analizar estos conocimientos en otras bases de datos es costoso, o simplemente no tienen la capacidad para todos los datos de escape. Apache Hadoop es capaz de almacenar todos los registros y datos de la web durante años y, a bajo costo, permite entender las rutas de los usuarios, hacer análisis de carritos, ejecutar pruebas A / B y priorizar las actualizaciones del sitio.
4. Hadoop como complemento al Datawareouse / Datamarts
Un uso más estratégico, aquí vemos lo que llamo potenciación o evolución de nuestro DW. Podremos adquirir una gran ventaja competitiva pues entre otra cosas podríamos reducir el coste al hacer off-loading de datos o transformaciones (casos ELT) del DWH a Hadoop, incorporar nuevas fuentes de datos las cuales nuestros DW no podrían gestionar como fuentes de datos no estructuradas o mutables (como el punto anterior, documentos, redes sociales, encuestas, etc) y uno de os pilares más importantes en el mundo empresarial hoy por hoy…el poder incorporar nuevas técnicas de análisis sobre los datos.
Es de resaltar una propuesta muy ambiciosa y llamativa para las organizaciones que deseen sobresalir, no solo poder incluir nuevos datos y KPIs externos si no aprovecharlos y cruzar mucha más información.
5. Localizar y personalizar promociones
Hadoop es una plataforma de cambio de juego que puede combinar tanto el almacenamiento histórico y el flujo de datos en tiempo real para permitir a las organizaciones localizar y personalizar sus promociones. Por ejemplo con aplicaciones para móviles podríamos enviar a los usuarios de aplicaciones notificaciones push personalizadas basadas en la ubicación geográfica para que los clientes cercanos a una tienda sean notificados de una promoción o producto específico que les atraiga. El acceso al historial de búsquedas en línea y la ubicación geográfica también son útiles para promover anuncios en las fuentes de las páginas de medios sociales de los clientes.
6. Data Archiving
Debido a que Hadoop es una tecnología de bajo coste para el almacenamiento y acceso a los datos. Podremos valernos de conseguir almacenar grandes bancos de datos históricos, que por su composición cuentan con accesos poco frecuentes y SLAs relajadas, Hadoop te permite construir una infraestructura para cubrir las necesidades. Podrás contar con almacenamiento de muchos años los cuales te permitirá disponer de ellos para análisis futuros, calcular predicciones o simplemente como un gran banco documental.
7. Repositorio centralizado de datos
Veámoslo como un DW distribuido un nivel mucho más estratégico donde prima la necesidad de centralizar los datos por ejemplo de todas sus sucursales, tiendas, ventas, etc. minimizando los silos independientes, permitiendo un cross-selling sinérgico, análisis multi-canal, unificación de KPIs y mucho más. Éste caso se apoya en la capacidad, tanto en almacenamiento como en procesamiento, de utilizar cualquier tipo de dato existente en la organización (o fuera de ella), y con escalabilidad ilimitada. Hadoop permite, además, abrir los datos a distintos enfoques o tecnologías de procesamiento: predictivos, regresivos, batch, online, MapReduce, SQL, R, SAS, etc. (siempre sobre los mismos datos y sobre la misma plataforma).
8. Análisis de sensores y operativa digitalizada
Este uso es particularmente emergente dentro de las organizaciones donde producen pedidos o productos a escala, podrías imaginarte conocer el estado actual de todo el flujo de la producción o disponer y almacenar mediante sensores la temperatura de algún componente dentro de la preparación de un producto (como su temperatura o estado) de manera que puedas prever riesgos, reduzcas los costos y mejores la eficiencia operativa.
9. Análisis de sentimiento
Cuando hablamos de análisis de sentimiento automáticamente pensamos en redes sociales, es cierto que la manera más directa de identificar que piensan de nosotros, nuestra marca u organización es leer los comentarios, cantidad de me gusta, cuanto nos comparten, etc. Pero también debemos tener presente que todos estos datos son no estructurados y que nos llegan en masa (grandes cantidades). Por eso gracias a la versatilidad de Hadoop puedes implementar este tipo de soluciones para tu organización.
10. (IoT) Internet de la cosas
Internet de la cosas nos provee un mundo de nuevas posibilidades, con la creciente creación de APIs y nuevos desarrollos podemos obtener datos de casi cualquier dispositivo (Bicicletas, Neveras, Casas, etc). Pero para almacenar, tratar y disponer de dichos datos necesitamos disponer de una plataforma escalable y potente como lo es Hadoop, permitiendo almacenar distintos tipos de datos y a grandes flujos de velocidad.
Como acabas de leer Hadoop abre un mundo de posibilidades, donde no solo se benefician las grandes organizaciones si no que gracias a su bajo costo de implementación y otras empresas que se encarguen de proveer estos servicios a bajo costo como SaaS, las empresa más pequeñas también pueden sacar provecho y hacer diferencia en sus respectivos nichos mejorando su competitividad.
Conocías alguno de los anteriores casos de uso de Hadoop? Te parece una gran ventaja implementar Hadoop como complemento estratégico? Podrías imaginarte otro caso de aplicación de Hadoop?