Aprende a montar un cluster hadoop BigData desde cero

Monta un cluster Hadoop-Big Data desde Cero

Aprende a instalar y configurar un cluster Hadoop con MapReduce, YARN, HIVE, SQOOP, SPARK, HBASE, HUE, etc....

Comprar el curso Vista previa gratuita

Contenido del curso

1. MÁQUINAS VIRTUALES PREPARADAS
2. Opciones disponibles para las prácticas y laboratorios del curso
3. Requisitos para las máquinas
4. Documento con la instalación completa
5. Crear un usuario y un directorio
6. Descargar Hadoop
7. Instalar Hadoop.
8. Directorios y ficheros generados
9. Instalar Las JDK de Java
10. Cofigurar variables de entorno
11. Fichero de entorno HADOOP_ENV.SH
12. Probar que hadoop funciona
13. Configurar SSH
14. Guia detallada de la configuración de SSH
1. Introducción a HDFS
2. Cluster Pseudistribuido (core-site.xml)
3. Cluster Pseudodistribuido (hdfs-site.xml)
4. Cluster Pseudodistribuido (Formatear HDFS)
5. Arrancar HDFS
6. Anexo: Cambio en el puerto WEB en la Versión 3 de Haddoop
7. Web de Administración de HDFS
8. Práctica- Guía detallada de configuración HDFS
9. Trabajar con HDFS-fsimage y edits
10. Práctica-Uso de Fsimage y Edits
11. Trabajar con ficheros
12. Trabajar con ficheros Parte 2
13. Trabajar con ficheros Parte3
14. Práctica- Trabajar con HDFS
15. HDFS-Algunos comandos de administración
16. Práctica- Trabajar con HDFS a nivel de administracion
17. HDFS-Snapshots
18. Práctica-Snapshots
1. Yarn y Map Reduce
2. Funcionamiento de YARN
3. Configurar YARN en un cluster
4. Web de Administración de YARN
5. Práctica-Guía detallada para montar un cluster Pseudo Distribuido
6. HADOOP 3:Modificación en YARN-SITE para Hadoop 3
7. Funcionamiento de Map Reduce
8. Un ejemplo con Map Reduce
9. Práctica-Trabajar con MapReduce
10. Un ejemplo de Map Reduce desde código Java
11. Práctica-Crear programas Map Reduce con Java
12. Un ejemplo de Map Reduce con streaming-Python
13. Práctica-Crear un Map Reduce con Python y Streaming
1. Máquinas virtuales preparadas para la sección
2. Requisitos para las prácticas de la sección
3. Consejo. Configurar SSH
4. Consejo. Copiar la configuración
5. HADOOP 3- CAMBIO DE NOMBRE DEL FICHEROS DE NODOS ESCLAVOS
6. Modificar los ficheros de configuración del Cluster
7. Arrancar el cluster
8. Práctica- Montar un cluster real
9. Probar un proceso Map Reduce contra el Cluster
10. Práctica-Lanzar un proceso MapReduce contra el cluster
11. Práctica-Streaming con comandos Shell de Linux
12. Práctica-Lanzar un programa Python contra el cluster
13. Comando YARN. Gestionar el cluster
14. Práctica-Comando YARN
15. Yarn Scheduler. Introducción a los planificadores
16. Yarn Scheduler- Ver su funcionamiento
17. Yarn-Scheduler. Configuración
18. Yarn Scheduler. Lanzar procesos MapReduce contra una cola
19. Práctica- Trabajar con el Yarn Scheduler
1. Introducción a las siguientes secciones
1. Introducción a Hive
2. Instalación y configuración inicial
3. Comandos HIVE
4. Configurar HDFS para usar HIVE
5. Primeros pasos-Crear Bases de Datos y Tablas
6. Hive-Primeros Pasos . Insertar, seleccionar....
7. Prácticas- Instalar, Configurar, Crear Bases de datos
8. Tablas internas y LOAD
9. Tablas Externas
10. Prácticas- Crear tablas externas e internas con columnas complejas
11. Conexiones remotas. HiveServer2 y Beeline
12. 10-presentacion
13. Recursos para los 2 vídeos siguientes
14. Ejemplo Real. Deslizamientos de Tierra. Parte 1
15. Ejemplo Real. Deslizamientos de Tierra. Parte 2. Hasta Excel
1. NOTA: Sistemas operativos soportados
2. Introducción a HUE
3. Compilar e instalar HUE
4. Práctica-Compilar HUE
5. Configurar y arrancar HUE
6. Práctica- Configurar y arrancar HUE
7. Un paseo por HUE
1. Introducción a SQOOP
2. Instalar y configurar Sqoop
3. Comandos SQOOP
4. NOTA:Versión de Base de datos
5. Descargar Oracle Express 11g
6. Instalar Oracle Express 11g
7. Comprobar que Oracle funciona
8. Configurar Oracle y JDBC
9. Importar datos de Oracle a HDFS
10. Exportar datos de HDFS a Oracle
11. Práctica. Importar datos con Sqoop
1. Introducción a Zookeeper
2. Instalar ZooKeeper
3. Configurar ZooKeeper
4. Arrancar ZooKeeper y comprobar
5. Práctica detallada de instalación y arranque
6. Cliente ZooKeeper: zkCli
7. Práctica con el cliente ZooKeeper
8. Introducción a la alta disponibilidad HDFS
9. Configurar alta disponibilidad HDFS
10. Arrancar HDFS en alta disponibilidad
11. Práctica: Configurar y arrancar el cluster HDFS
12. Comprobar que el cluster HDFS funciona
1. Introducción a spark parte 1
2. Introducción a spark parte 2
3. Descarga de Spark
4. Arquitectura de procesos de Spark
5. Probar que Spark funciona. Modo cliente
6. Instalar Spark
7. Spark y Hadoop. Trabajar con HDFS
8. Lanzar un programa SPARK (Scala) contra YARN
9. Lanzar un Programa Spark (Python) contra el cluster
10. Spark en modo StandAlone Parte 1
11. Spark en modo StandAlone Parte 2
1. Introducción a Hbase
2. Arquitectura de Hbase
3. Instalación Standalone Parte 1
4. Instalacion Standalone Parte 2
5. Conceptos de Hbase
6. Trabajar con Hbase Shell
7. Crear tablas e insertar datos
8. Scan y get
9. Delete, update y versionado
10. Hbase en modo pseudo-distribuido
11. Hbase en modo Cluster completo
1. NOTA IMPORTANTE. Sistemas operativos soportados
2. Introducción a Ambari
3. Introducción a la instalación. Requisitos
4. Generar los paquetes de Ambari
5. Configurar el servidor ambari
6. Instalar el cluster de Hadoop con Ambari Parte I
7. Instalar el cluster de Hadoop con Ambari Parte I!

Sobre este curso

$50.00
145 lecciones
12 horas de contenido de video
Máquinas virtuales preparadas
Múltiples prácticas y laboratorios

Requisitos previos

Se necesitan ciertos conocimientos de Linux, aunque no de un nivel avanzado
También sería deseable que supieras algo de Java, aunque no es obligatorio
Necesitas una máquina con al menos 8 Gigas de RAM, aunque para poder tener 3 nodos hadoop funcionando sería conveniente disponer de 12 Gigas

DESCRIPCIÓN DEL CURSO

Durante este curso vamos a aprender los conceptos y componentes que os permitirán trabajar con un entorno de BigData y Hadoop y montar un cluster con esta tecnología y veremos los productos y herramientas más habituales de este ecosistema

Válido para versiones 2 y 3 de Hadoop

¿Qué contenidos vamos a ver?

- Aprenderás los conceptos básicos de esta tecnología

- Verás como descargar e instalar Hadoop manualmente

- También aprenderás a instalar y configurar Hadoop con ambari

- Trabajarás con HDFS para entender la gestión de ficheros en Hadoop

- Instalarás y configuraras Map Reduce y YARN

- Aprenderás a instalar y configurar los productos y herramientas más usadas dentro del ecosistema Hadoop:

HIVE
SQOOP
SPARK
HUE
ZooKeeper
HBASE
PIG
FLUME
Otros productos que iré subiendo y actualizando

¡¡¡¡Con máquinas virtuales preparadas para el curso!!!!

- Una máquina básica en Linux Centos 6 con la que podrás hacer todas las prácticas desde el principio

- Tres máquinas virtuales en Linux Centos 7 con Hadoop ya instalado y configurado en modo Cluster con las que podrás empezar a trabajar con Hadoop sin necesidad de hacer la parte de instalación y configuración inicial

En resumen, este curso te capacitará para poder empezar a desarrollar y usar esta infraestructura en tu entorno laboral.

El curso será sobre todo práctico, de forma que aprendas de forma amena, divertida y también productiva

Cualquier duda estamos a tu disposición. Pregunta sin problemas¡¡¡¡

Espero lo disfrutes¡¡¡¡¡

Monta un cluster Hadoop-Big Data desde Cero

Contenido del curso

Introducción

Preparar el entorno necesario para Hadoop

Montar un cluster de un solo nodo. Aprender HDFS

YARN-MApReduce

Montar un cluster Real

Productos asociados a Big Data

HIVE

HUE

SQOOP

Zookeeper y Alta disponibilidad en Hadoop

SPARK

HBASE

Montar un cluster con Ambari

Sobre este curso

Requisitos previos

DESCRIPCIÓN DEL CURSO