TEMA 1: Introducción a los sistemas distribuidos

El paradigma clásico cliente-servidor es lo que se llama centralizado. Un ejemplo de arquitectura distribuida sería una red P2P (como torrent). Y por último un ejemplo de red descentralizada sería una red como la red Tor.

1. Introducción a los SSDD

Qué es un sistema distribuido

Un sistema distribuido es un conjunto de computadores débilmente acoplados (independientes) interconectados a través de una red que colaboran para realizar una tarea. Los orígenes se remontan a los años 80:

Principios de los 80: Los computadores son máquinas costosas y muy grandes. Sistemas operativos multiusuario de tiempo compartido.
A partir de los años 80: Auge de los computadores personales. Bajo coste. Avances tecnológicos continuos. SO monousuario.
A partir de los años 90: Aparecen las redes de computadores de alta velocidad (LAN y WAN).

Propiedades de los sistemas distribuidos

Concurrencia de los componentes: no se habla ya de concurrencia a nivel de componente del computador, si no de los distintos computadores que componen el sistema.
Carencia de un reloj global: no existe un reloj que sincronice todos los computadores, sino un coreógrafo que se dedica a hacerlo.
Fallos independientes de los componentes: si falla una máquina se balancea la carga a otras máquinas.
Uso de un sistema de comunicación: WAN, LAN, etc.
Ausencia de memoria común: entendiendo como memoria, la física (RAM, HD). Sin embargo, puede y hay BD compartida.
Sincronización del trabajo
Ausencia de un estado global
Comunicación a través de mensajes

Ejemplos de sistemas distribuidos

Internet
Intranet
Computación móvil y ubicua: computación que se puede llevar a cabo en cualquier lugar
Redes P2P
Grid computing: paralelizar el problema a resolver con varios equipos para reducir el tiempo de resolución. De ahí viene el nombre de "grid" es una cuadrícula de equipos en paralelo.
Redes de sensores
Red bancaria
Servidor FTP
BD distribuidas

2. Características de los SSDD

El principal objetivo de un SD es que el sistema se presente a los usuarios como un único computador monoprocesador virtual. Para ello se persiguen los siguientes conceptos:

Transparencia	Descripcion
Acceso	Diferencias en la representación de los datos y como acceder a los recursos
Localización	Dónde se encuentra un recurso
Migración	Que un recurso pueda moverse de un lugar a otro
Relocalización	Que un recurso pueda moverse de un lugar a otro mientras está en uso
Replicación	Que puedan existir réplicas de un recurso
Concurrencia	Que un recurso pueda ser compartido por varios usuarios
Resiliencia	Permitir la recuperación de un recurso en caso de fallos sin que se vea afectado
Persistencia	Que un recurso pueda estar en memoria o en disco

Seguridad en SSDD

En un sistema distribuido la información se transmite entre los diferentes nodos del mismo mediante paso de mensajes. Hay varios requisitos para garantizar la seguridad:

El emisor debería saber que su mensaje se ha recibido.
El receptor de un mensaje debería saber que el que le ha enviado el mensaje es el emisor adecuado.
Tanto el emisor como el receptor deberían tener garantías de que los mensajes no son observados ni alterados durante la transmisión (no hay un ataque MITM).

Rendimiento en SSDD

La existencia de más recursos debería permitir que las apps se ejecuten más rápido en un SD que en uno centralizado. Sin embargo, hay algunos problemas:

Las apps tienen que ser paralelizadas
Minimizar el tráfico de red
Equilibrio de carga
Conseguir que un SD sea transparente, flexible y fiable

Heterogeneidad

Un SD se puede componer de conjuntos de computadores que pueden difrerir tanto en HW como en SW, esto implica que pueda haber incompatibilidades:

Los CPUs y lenguajes no usan la misma representación de los datos
Gran diversidad de protocolos

## 3. Protocolos - **Servicios de red:** capa de servicios estándar en internet: HTTP, DNS, FTP, SMTP - **Servicios web:** conjunto de servicios montados sobre HTTP: motores de búsqueda, servicios de directorio, cambio de moneda, SMS. Utilizan SOAP y XML. - **Apps de red:** aplicaciones específicas desarrolladas por usuarios finales. Utilizan middlewares para la comunicación. ## 4. Tipos de sistemas ### Computación en clúster Conjunto de computadores similares conectados a través de una red LAN de alta velocidad. Se usa para computación en paralelo usualmente. Cada clúster es un conjunto de nodos "slave" monitoreados por los nodos "master". ### Computación en red Nodos con marcadas diferencias de hardware y tecnología de red. ### Computación en la nube Recursos virtualizados alojados en el centro de datos del proveedor. Para el usuario, está "alquilando su propia máquina", sin embargo, seguramente sea compartida con otros usuarios. Son bastante escalables ya que permiten configurarse dinámicamente. #### Modelos de computación en la nube !

### Plataformas de computación en la nube #### Amazon Web Services (AWS) !

#### Google Cloud Platform (GCP) !

#### Microsoft Azure !

## 5. Problemas - **Compatibilidad de tipos de datos:** distintos SO que tienen distintos tipos de datos que no siempre son compatibles entre sí. - **Fallos del servido:** debido a que los componentes pueden ser remotos, un fallo de cualquiera puede hacer que toda la app falle. - **Fallos del cliente:** el servidor debe saber como responder a fallos del cliente. - **Reintento de llamadas:** si se hace una llamada a un método en un servidor para generar una orden de compra muy grande, y el servidor responde, pero se pierde la respuesta por un fallo de red, no es muy eficiente volver a enviar la orden de compra. - **Seguridad:** autenticar a los usuarios, cifrar la información que viaja por la red, evitar DDoS, etc. - **Sincronización de la hora:** para que no haya incoherencia con la hora real. - **Formato de los datos** - **Disponibilidad de los servidores** - **Acceso a los sistemas de forma remota** - **Posibilidad de ver los datos por muchas personas** # TEMA 2: Modelos y arquitecturas ## 1. Introducción - Cómo interaccionan los módulos - Qué roles ejercen los procesos involucrados - Cuál es su correspondencia con nodos físicos - "Topología" de la aplicación distribuida ### Patrones más conocidos Las arquitecturas más frecuentes en SSDD son: - Cliente/Servidor - P2P - Editor/Subscriptor - Arquitectura de varios niveles ## 2. Arquitectura Cliente/Servidor Un equipo llamado servidor, realiza ciertas tareas denominadas **servicios**, como pueden ser ofrecer archivos, ejecutar comandos, enrutar datos a una impresora, etc. El cliente es el equipo que **solicita los servicios**. ### Desventajas El servidor, a medida que se necesita escalabilidad, puede transformarse en un cuello de botella y por tanto convirtiéndose el servidor en un punto crítico de fallo. ### Características varias El servidor ofrece una colección de servicios que el cliente debe conocer. Normalmente se realizan peticiones específicas al servidor: recurso, operación, etc. ### Reparto de funcionalidad Respecto al "grosor" (cantidad de trabajo que realiza) del cliente: - **Ligeros (Thin/Lean/Slim Client):** - Menor coste de operación y mantenimiento - Mejor seguridad - **Pesados (Thick/Fat/Rich Client):** - Mayor autonomía a cambio de gastar más recursos locales - Mejor escalabilidad: el cliente gasta menos recursos de red y servidor - Más ágil en respuesta al usuario ### Conexiones En el caso de usar esquema con conexión: - 1 conexión por cada petición: 1 operación C-S - Más sencillo pero mayor sobrecarga (9 mensajes TCP por petición) Como solución: varias peticiones usan una misma conexión - Más complejo pero menor sobrecarga - 1 cliente 1 conexión ### Estados - **Ventajas de servicios con estado** - Mensajes de petición más cortos - Mejor rendimiento (pero información en memoria) - Favorece optimización del servicio con predicciones - **Ventajas de servicio sin estado** - Más tolerante a fallos - Peticiones autocontenidas - Reduce el nº de mensajes - Más económicos para el servidor (menos uso de memoria) - **Servicio sin estado (stateless) de la propuesta REST** - El estado que se almacena lo hace el cliente y lo envía al servidor (ej: HTTP+cookies) ## 2. Arquitectura Publisher/Subscriber Es un sistema de eventos distribuidos: - Un subscriptor S (subscriber) muestra interés por eventos y se subscribe a ciertos eventos. - Un editor P (publisher) genera un evento y se lo envía a subscriptores interesados en el mismo. - Operaciones: - Subscribir \[alta/baja\] (S$\rightarrow$) - Publicar (P$\rightarrow$) - Notificar ($\rightarrow$S) ### Características - Paradigma asíncrono y desacoplado espacialmente - Editores y subscriptores no se conocen entre sí (a diferencia de C-S) - En algunos casos también desacoplado temporalmente - Normalmente es _push_ (subscriptor recibe notificaciones), y como alternativa está el _pull_ subscriptor pregunta si hay mensajes, pero no es nada escalable. ## 3. Arquitectura P2P - **Desestructurados:** - Ubicación de recursos impredecible - Cada nodo posee recursos - Corresponden a sistemas con nodos más autónomos - **Estructurados:** - Ubicación de recursos predecibles y dependiente de la topología - Generalmente definida por función hash distribuida para buscar la máquina que posee el recurso - Corresponden a sistemas con nodos más cooperativos # TEMA 3: Procesos locales ## 1. Sockets Un **socket** es un método para comunicar programas entre sí mediante el paradigma C-S. Un socket también es una dirección en internet tipo IP:puerto. ## 2. Servlets Programa Java que se ejecuta en un servidor Web y construye o sirve páginas web. De esta forma se pueden construir páginas dinámicas, basadas en diferentes fuentes variables.

12 KiB Raw Blame History