Información general
Gracias a servicios como Amazon RDS y Amazon Aurora, las bases de datos se pueden transportar y cambiar de la base de datos relacional existente de los servidores en las instalaciones a AWS. A medida que aumenta el tamaño de los datos, también lo hace la complejidad de administrar un sistema de administración de bases de datos relacionales (RDBMS, relational database management system) tradicional. Para seguir el ritmo de las crecientes opciones de tamaños y variedades de datos, sumados a la demanda de recuperación de datos rápida, es importante considerar el uso de bases de datos no relacionales (también llamadas “NoSQL”).
Bases de datos no relacionales: las bases de datos no relacionales utilizan una variedad de modelos de datos para acceder a los datos y administrarlos. Algunos ejemplos incluyen documentos, gráficos, clave-valor, datos en memoria y búsquedas. Estos tipos de bases de datos se optimizan específicamente para aplicaciones que requieren de grandes volúmenes de datos, baja latencia y modelos de datos flexibles, los cuales se alcanzan mediante la posibilidad de flexibilizar algunas de las restricciones de consistencia de datos de otras bases de datos.
En este laboratorio, buscará un enfoque para convertir un modelo de datos relacionales en un modelo de datos no relacionales e importar los datos convertidos a Amazon DocumentDB (compatible con MongoDB). Ejecutará consultas complejas para cumplir los objetivos del negocio. Investigará las opciones de supervisión de rendimiento y respaldo.
Amazon DocumentDB: Amazon DocumentDB está diseñado desde cero para suministrar el nivel de rendimiento, escalabilidad y disponibilidad que necesita a la hora de utilizar cargas de trabajo de MongoDB críticas a gran escala. Amazon DocumentDB implementa el código abierto MongoDB 3.6 de Apache 2.0 y API 4.0 mediante la simulación de respuestas que un cliente de MongoDB espera de un servidor de MongoDB, lo que le permite utilizar sus controladores y herramientas de MongoDB con Amazon DocumentDB. En Amazon DocumentDB, el almacenamiento y el cómputo están desacoplados, lo que permite que cada uno escale de manera independiente y que usted pueda incrementar la capacidad de lectura a millones de solicitudes por segundo mediante la adición de hasta 15 réplicas de lectura de baja latencia en minutos, sin importar el tamaño de sus datos. Amazon DocumentDB está diseñado para ofrecer una disponibilidad del 99,99 % y replica 6 copias de los datos en 3 zonas de disponibilidad de AWS.
Objetivos
Después de completar este laboratorio, podrá realizar lo siguiente:
- evaluar datos relacionales y no relacionales
- cargar y verificar datos en Amazon DocumentDB
- ejecutar consultas complejas para cumplir los objetivos del negocio
- supervisar el estado y el rendimiento de Amazon DocumentDB
- restaurar una base de datos de Amazon DocumentDB desde una copia de respaldo
Requisitos previos
Los requisitos de este laboratorio son los siguientes:
- tener acceso a una computadora portátil con wifi y Microsoft Windows, macOS X o Linux (Ubuntu, SuSE o Red Hat)
- Nota: Puede utilizar un iPad o una tableta para acceder a estas indicaciones en la consola del laboratorio.
- utilizar un navegador de Internet, como Chrome, Firefox o IE9+
- Nota: No se admiten las versiones anteriores de Internet Explorer.
- tener un cliente de SSH, como PuTTY
Conocimientos técnicos requeridos
Para completar correctamente este laboratorio, debe estar familiarizado con lo siguiente:
- Navegación básica de la consola de administración de AWS
- Comprensión de los conceptos sobre bases de datos, MySQL y disponibilidad de bases de datos.
Duración
Se requieren 60 minutos para completar este laboratorio.
Servicios de AWS que no se utilizan en este laboratorio
En el entorno de laboratorio, los servicios de AWS que no se utilizan en este laboratorio están desactivados. Además, las capacidades de los servicios que se utilizan en este laboratorio se limitan a lo que este requiere. Es probable que reciba mensajes de error cuando acceda a otros servicios o cuando lleve a cabo acciones que no consten en la guía de este laboratorio.
Entorno del laboratorio
El entorno de laboratorio ya incluye los componentes necesarios, como las instancias de Amazon EC2, los roles de AWS Identity and Access Management (IAM) y una base de datos de Amazon DocumentDB. El laboratorio contiene instrucciones para revisar el código, configurar las variables necesarias y ejecutar los scripts, de modo que pueda configurar esos componentes cuando sea necesario.
Las instancias de base de datos se colocan en distintas zonas de disponibilidad dentro de subredes privadas, y se aprovisiona una instancia de Amazon EC2, que actúa como CommandHost, en una subred pública con acceso a Internet. Para acceder a la base de datos, primero debe conectarse al CommandHost y, a continuación, conectarse a las instancias de base de datos mediante el puerto 27017. Las consultas también se ejecutarán con las funciones de AWS Lambda y Amazon API Gateway, que se han aprovisionado para usted. AWS Secrets Manager también se configuró para almacenar las credenciales de Amazon DocumentDB.