Monta un cluster Hadoop-Big Data desde Cero
Aprende a instalar y configurar un cluster Hadoop con MapReduce, YARN, HIVE, SQOOP, SPARK, HBASE, HUE, etc....
Introducción al curso
VISTA PREVIA GRATUITAIntroducción y repaso de Big Data
VISTA PREVIA GRATUITAIntroducción a Hadoop
VISTA PREVIA GRATUITAHerramientas y productos asociados a Hadoop
VISTA PREVIA GRATUITADistribuciones Hadoop
VISTA PREVIA GRATUITAComponentes del software de Hadoop
VISTA PREVIA GRATUITAMÁQUINAS VIRTUALES PREPARADAS
Opciones disponibles para las prácticas y laboratorios del curso
Requisitos para las máquinas
Documento con la instalación completa
Crear un usuario y un directorio
Descargar Hadoop
Instalar Hadoop.
Directorios y ficheros generados
Instalar Las JDK de Java
Cofigurar variables de entorno
Fichero de entorno HADOOP_ENV.SH
Probar que hadoop funciona
Configurar SSH
Guia detallada de la configuración de SSH
Introducción a HDFS
Cluster Pseudistribuido (core-site.xml)
Cluster Pseudodistribuido (hdfs-site.xml)
Cluster Pseudodistribuido (Formatear HDFS)
Arrancar HDFS
Anexo: Cambio en el puerto WEB en la Versión 3 de Haddoop
Web de Administración de HDFS
Práctica- Guía detallada de configuración HDFS
Trabajar con HDFS-fsimage y edits
Práctica-Uso de Fsimage y Edits
Trabajar con ficheros
Trabajar con ficheros Parte 2
Trabajar con ficheros Parte3
Práctica- Trabajar con HDFS
HDFS-Algunos comandos de administración
Práctica- Trabajar con HDFS a nivel de administracion
HDFS-Snapshots
Práctica-Snapshots
Yarn y Map Reduce
Funcionamiento de YARN
Configurar YARN en un cluster
Web de Administración de YARN
Práctica-Guía detallada para montar un cluster Pseudo Distribuido
HADOOP 3:Modificación en YARN-SITE para Hadoop 3
Funcionamiento de Map Reduce
Un ejemplo con Map Reduce
Práctica-Trabajar con MapReduce
Un ejemplo de Map Reduce desde código Java
Práctica-Crear programas Map Reduce con Java
Un ejemplo de Map Reduce con streaming-Python
Práctica-Crear un Map Reduce con Python y Streaming
Máquinas virtuales preparadas para la sección
Requisitos para las prácticas de la sección
Consejo. Configurar SSH
Consejo. Copiar la configuración
HADOOP 3- CAMBIO DE NOMBRE DEL FICHEROS DE NODOS ESCLAVOS
Modificar los ficheros de configuración del Cluster
Arrancar el cluster
Práctica- Montar un cluster real
Probar un proceso Map Reduce contra el Cluster
Práctica-Lanzar un proceso MapReduce contra el cluster
Práctica-Streaming con comandos Shell de Linux
Práctica-Lanzar un programa Python contra el cluster
Comando YARN. Gestionar el cluster
Práctica-Comando YARN
Yarn Scheduler. Introducción a los planificadores
Yarn Scheduler- Ver su funcionamiento
Yarn-Scheduler. Configuración
Yarn Scheduler. Lanzar procesos MapReduce contra una cola
Práctica- Trabajar con el Yarn Scheduler
Introducción a las siguientes secciones
Se necesitan ciertos conocimientos de Linux, aunque no de un nivel avanzado
También sería deseable que supieras algo de Java, aunque no es obligatorio
Necesitas una máquina con al menos 8 Gigas de RAM, aunque para poder tener 3 nodos hadoop funcionando sería conveniente disponer de 12 Gigas
Durante este curso vamos a aprender los conceptos y componentes que os permitirán trabajar con un entorno de BigData y Hadoop y montar un cluster con esta tecnología y veremos los productos y herramientas más habituales de este ecosistema
Válido para versiones 2 y 3 de Hadoop
¿Qué contenidos vamos a ver?
- Aprenderás los conceptos básicos de esta tecnología
- Verás como descargar e instalar Hadoop manualmente
- También aprenderás a instalar y configurar Hadoop con ambari
- Trabajarás con HDFS para entender la gestión de ficheros en Hadoop
- Instalarás y configuraras Map Reduce y YARN
- Aprenderás a instalar y configurar los productos y herramientas más usadas dentro del ecosistema Hadoop:
¡¡¡¡Con máquinas virtuales preparadas para el curso!!!!
- Una máquina básica en Linux Centos 6 con la que podrás hacer todas las prácticas desde el principio
- Tres máquinas virtuales en Linux Centos 7 con Hadoop ya instalado y configurado en modo Cluster con las que podrás empezar a trabajar con Hadoop sin necesidad de hacer la parte de instalación y configuración inicial
En resumen, este curso te capacitará para poder empezar a desarrollar y usar esta infraestructura en tu entorno laboral.
El curso será sobre todo práctico, de forma que aprendas de forma amena, divertida y también productiva
Cualquier duda estamos a tu disposición. Pregunta sin problemas¡¡¡¡
Espero lo disfrutes¡¡¡¡¡