Bienvenidos sean a este post, hoy las categorias de ML para aprender.
Al final del post anterior mecionamo que ML puede ser dividido en cateogorias. Ahi mencionamos dos de estas pero se dividen en tres: supervisadas, sin supervisar y reforzamiento. Estas categorizaciones de algoritmos de ML dependen en el tipo de experiencia que tienen durante el proceso de aprendizaje. Por lo general, la coleccion de ejemplos se denomina como dataset, algunos libros tambien los denominan como puntos de datos.
Un dataset es basicamente una coleccion de datos representando cualquier cosa util para el sistema de destino. Estos pueden ser mediciones meteorologicas para ciertos periodos de tiempo, una lista de precios para el deposito de una compañia o varias, o tipos de datos necesarios para nuestras aplicaciones. Los dataset son datos sin procesar o comunmente denominados como raw, tambien existen dataset que contienen informacion adicional para cada experiencia contenida.
En el ejemplo del post anterior, el dataset que le pasamos a MaquinaCalculos es de tipo raw. A su vez, programamos al sistema para reconocer que los primeros dos valores son los operandos y el tercero es el resultado. Pasemos a hablar sobre las distintas categorias.
Los algoritmos de aprendizaje supervisados lo hacen desde dataset etiquetados; este dato adicional nos describe al dato, siendo MaquinaCalculos un ejemplo de esta categoria. A este tambien se lo denomina como entrenamiento con un instructor, y este instructor enseña al sistema con el dataset. Este va a tener la posibilidad de etiquetar nuevos datos desconocidos despues de aprender de las experiencias provistas. Un buen ejemplo de esta categoria es el filtro de spam para los emails. Los usuarios etiquetan a los emails como spam o no y luego el sistema intenta encontrar patrones en nuevos emails entrantes para detectar potenciales emails spam.
Si tomamos el ejemplo del post anterior, cuando pasamos la informacion a MaquinaCalculos al momento de recibir la procesara de la forma que la programamos. En este caso, toma los dos primeros valores como argumentos de entrada y el tercero como el resultado de una funcion utilizada con los dos anteriores. Es decir, le proveemos toda la informacion necesaria para que el sistema sepa de que manera obtener el resultado.
Los algoritmos de aprendizaje sin supervision son un poco mas complejos porque se procesa al dataset conteniendo un racimo de caracteristicas y luego intenta encontrar propiedades utiles de las caracteristicas. A estos usualmente se los dejan solos para que definan que contiene el dataset. Como podran darse cuenta, este tipo de algoritmos encajan mas con el concepto de criatura inteligente con respecto a la categoria anterior. Con todo lo mencionado podemos decir que los algoritmos supervisados tratan de predecir cuales valores de entrada mapean a los valores de salida, mientras que los algoritmos no supervisados ejecutan varias operaciones para descubrir patrones en un dataset. Ejemplos de algoritmos sin supervisar son los sistemas de recomendaciones, este analiza la actividad del usuario para recomendar datos similares, por ejemplo peliculas recomendadas.
Por ultimo, tenemos a la categoria reforzamiento. Este tiene la particularidad de aprender de los errores. Hay un loop de feedback entre el sistema de aprendizaje y sus experiencias, asi que este algoritmo interactua con un entorno. Obviamente, esto genera un monton de errores al inicio, y luego de procesar el feedback, se corrige a si mismo para mejorar el algoritmo.
Por ende, el proceso de aprendizaje se torna parte de la tarea de ejecucion. Supongamos que MaquinaCalculos recibe solo numeros de entrada pero no el resultado de los calculos. Para cada experiencia, este producira un resultado aplicando una de las operaciones aritmeticas y luego recibe un feedback. Puede que inicialmente comience calculando la resta de los valores pero luego en base al feedback se modifica a si mismo para calcular la suma.
En resumen, hoy hemos visto las categorias de ML, cuantas son, como se comportan, sus caracteristicas, asi como otras particularidades. Espero les haya resultado de utilidad sigueme en tumblr, Twitter o Facebook para recibir una notificacion cada vez que subo un nuevo post en este blog, nos vemos en el proximo post.


Donación
Es para mantenimento del sitio, gracias!
$1.50
