Introducción:
En este post, exploraremos en detalle los fundamentos teóricos del aprendizaje supervisado y no supervisado, dos enfoques fundamentales en el campo del aprendizaje automático. Descubrirás cómo funcionan estos enfoques, ejemplos de algoritmos en cada categoría y cómo elegir entre ellos según el problema que estés abordando. Prepárate para adentrarte en los conceptos teóricos y fortalecer tus conocimientos sobre los fundamentos del aprendizaje automático.
Aprendizaje supervisado
El aprendizaje supervisado es el más común utilizado entre los dos , incluye algoritmos tales como regresión lineal y logístico, clasificación de clases múltiples y máquinas de vectores de soporte.
El aprendizaje supervisado se llama así porque el desarrollador actúa como una guía para enseñar al algoritmo las conclusiones a las que debe llegar, es decir la salida del algoritmo ya es conocida. Es similar a la forma en que un niño podría aprender de un maestro.
Requiere que los posibles resultados del algoritmo ya sean conocidos y que los datos utilizados para entrenar el algoritmo ya estén etiquetados con las respuestas correctas. Por ejemplo, un algoritmo de clasificación aprenderá a identificar animales después de haber sido entrenados en un conjunto de datos de imágenes que están paropiadamente etiquetados con las especies del animal y algunas características de identificación.
Aprendizaje no supervisado
El aprendizaje no supervisado está más estrechamente alineado con la inteligencia artificial, ya que la idea de que una computadora pueda aprender a identificar procesos y patrones complejos sin un humano para proporcionar orientación a lo largo del camino. Algunos ejemplos de algoritmos de aprendizaje no supervisado incluyen clustering o agrupamiento, k-means y reglas de asociación.
Acá no existe un conjunto de datos de entrenamiento y los resultados son desconocidos. Esencialmente, se entra en el problema de manera ciega y con solo operaciones lógicas impecables para guiarlo, aunque parezca increible, el aprendizaje no supervisado es la capacidad de resolver problemas complejos utilizando solo los datos de entrada y los alogoritmos lógicos, y en ningún momento se tiene datos de referencias.
Un ejemplo muy simple de ambos aprendizaje es que digamos que tenemos una imagen digital que muestra una serie de formas geométricas de colores que debemos unir en grupos según su clasificación y color, este es un problema muy común en las aplicaciones de reconocimiento de imágenes de Machine Learning.
Con el aprendizaje supervisado, la solución a este problema es bastante sencillo, simplemente le enseñamos a la computadora que las formas con cuatro lados se conocen como cuadrados y las formas de tres lados se conocen como triángulos. También le indicamos que si la luz emitida por un pixel registra ciertos valores, lo clasificamos rojo y otro conjunto de valores como azul. De esta forma muy sencilla nuestro algoritmo ha aprendido a agrupar el conjunto de formas geométricas dado.
Ahora bien con el aprendizaje no supervisado, la solución a este problema se vuelve un poco más complicado. Acá el algoritmo tiene los mismos datos de entrada, imágenes digitales que muestran formas geométricas en diferentes colores y queremos ordenarlos en grupos. Para solucionar este problema, el algoritmo aprende de la información: el problema es de clasificación y que algunas de las formas coinciden con otras, quizás con el mismo número de lados o con marcadores digitales que coinciden con el color. El algoritmo no puede saber que el nombre de los objetos es cuadrado o triangulo, pero si reconocerá otros objetos con más o menos las mismas características y los agrupará asignándoles su propia etiqueta. De esta forma el algoritmo ha resulto el problema dado.
Tecnicamente no hay respuesta correcta o incorrecta, Machine Learning simplemente aprenderá la verdad objetiva de que ciertas formas pertenecen juntas hasta cierto grado de probabilidad. Obviamente, Machine Learning comete errores pero, como nosotros, su fortaleza radica en su capacidad para aprender de sus errores y hacer estimaciones mejor educadas la próxima vez.
La elección de de utilizar un algoritmo de Machine Learning supervisado o no supervisado generalmente depende de factores relacionados con la estructura y el volumen de sus datos y del objetivo del problema en cuestión. Un problema complejo por lo general utilizará ambos tipos de algoritmos para construir modelos de datos predictivos que ayuden a tomar decisiones sobre una variedad de desafíos comerciales.
Conclusión:
En este post, hemos explorado los fundamentos teóricos del aprendizaje supervisado y no supervisado. Has aprendido cómo funcionan estos enfoques, ejemplos de algoritmos en cada categoría y cómo elegir entre ellos según el problema que estés abordando. El aprendizaje supervisado se basa en datos etiquetados y se utiliza para hacer predicciones y clasificaciones, mientras que el aprendizaje no supervisado se basa en datos no etiquetados y se utiliza para descubrir patrones y estructuras ocultas.



