diff --git a/.obsidian/workspace.json b/.obsidian/workspace.json index a4436f3..3d7e473 100644 --- a/.obsidian/workspace.json +++ b/.obsidian/workspace.json @@ -13,12 +13,12 @@ "state": { "type": "markdown", "state": { - "file": "TERCERO/SS/SS 24-25.md", + "file": "TERCERO/IA/Teoría_2425.md", "mode": "source", "source": false }, "icon": "lucide-file", - "title": "SS 24-25" + "title": "Teoría_2425" } } ] @@ -177,8 +177,8 @@ }, "active": "7d00eaebf5db2f27", "lastOpenFiles": [ - "TERCERO/SS/SS Lab.md", "TERCERO/SS/SS 24-25.md", + "TERCERO/SS/SS Lab.md", "TERCERO/SPD/P4_SPD.md", "TERCERO/SPD/Teoría_2425.md", "TERCERO/SS/images/Pasted image 20241024113018.png", diff --git a/TERCERO/IA/Teoría_2425.md b/TERCERO/IA/Teoría_2425.md index 5d8bef4..7708c8e 100644 --- a/TERCERO/IA/Teoría_2425.md +++ b/TERCERO/IA/Teoría_2425.md @@ -369,3 +369,14 @@ Se puede usar una estrategia, llamada **UCB (Upper Confidence Bound)** que const 3. **Simulación:** partiendo del estado recién añadido se simula una partida completa, ya sea al azar o con una heurística. Se obtiene un valor (premio, recompensa, etc) que determina la utilidad de esa rama para el jugador. 4. **Actualización:** con el estado final alcanzado de la fase anterior se actualizan las estadísticas de todas las posiciones previas visitadas durante la simulación que se ejecutó a partir del nuevo estado (incluyendo la cuenta de ganancias). ![[mcts.gif]] + +# TEMA 6: Fundamentos de ML +Básicamente se trata de crear algoritmos capaces de generalizar comportamientos y reconocer patrones a partir de unos datos de entrada. De la forma: +$$ +\begin{equation} +f:D\rightarrow r +\end{equation} +$$ +sea $f$ una función que dados unos datos $D$ da un resultado $r$. Hace falta saber, **cómo** se manipulan los datos, **qué** datos se cogen y cómo calcular los **errores**. ML es una mezcla de técnicas de álgebra (para representación vectorial de los parámetros de $f$) y optimización. +### Aprendizaje supervisado +Se trata de $D\rightarrow ML\rightarrow f~aprox~D$ (o minimizar el error entre $D$ y $f$). Los datos se suelen dividir en dos bloques, uno de **entrenamiento** ($D_{train}$), y otro de **validación** ($D_{val}$) para calcular el error empírico (ya que esos datos "no los ha visto"). También puede haber un tercer bloque de **test** ($D_{test}$) para usarse luego de repetir varias veces el entrenamiento.