Skip to main content

Últimos artículos

Oozie_Hadoop

Oozie: Programando Jobs en Hadoop

Una funcionalidad indispensable en cualquier proyecto de sistemas es el poder programar ejecuciones o acciones que realicen distintas tareas en ciertos periodos de tiempo. Por ejemplo, ejecutar la carga de nuestra bodega diariamente, ejecutar transformaciones ...
Leer Más
MongoDB+R+OpenData

MongoDB + R + Open Data

Uno de las principales ventajas del Big Data son las tecnologías emergentes, las mismas nos dan la posibilidad de interactuar con distintas soluciones que satisfacen requerimientos puntuales en nuestro desarrollo (esto se conoce como persistencia ...
Leer Más
Sqoop

Sqoop: Poblando Hadoop desde RDBMS

Una de las principales fuentes del Big Data son la bases de datos relaciones, en una organización pueden existir millones de registros en distintas tablas, transacciones por segundo o incluso muchos años de historia. Lo ...
Leer Más
SparkR

SparkR: R a Gran Escala!

Gracias al auge del Científico de Datos, escuchamos con frecuencia uno de los software más influyentes en la actualidad analítica y estadística llamado R. R nos permite entre muchísimas cosas trabajar con DataFrames de datos ...
Leer Más
Hive_Hadoop

Hive: SQL y Data Warehouse en Hadoop

Gracias al auge del procesamiento de grandes bancos de datos que demandan hoy en día las organizaciones, es normal imaginarse si en éste nuevo mundo escalable y distribuido de Hadoop es posible realizar consultas SQL ...
Leer Más
Pig_Hadoop_Blog_Jacagudelo

Pig Hadoop: Devorando datos

Como vimos en el artículo del ecosistema Hadoop podemos encontrar distintos proyectos para realizar consultas, trabajar con bases de datos y hasta realizar estudios de machine learning entre otros. Por eso en éste artículo hablaremos ...
Leer Más