Qué es el ‘machine learning’ y cómo funciona

1 month ago 39

Qué es el machine learning

El machine learning, también llamado aprendizaje automático o aprendizaje de máquinas, es el campo de la inteligencia artificial (IA) que desarrolla técnicas para que las máquinas aprendan a solucionar problemas o realizar tareas de forma autónoma.

Vincent Adam, doctor en machine learning e investigador en la universidad Pompeu Fabra, explica que un algoritmo es una función que toma un input (entrada) y produce un output (salida). Por ejemplo, en un algoritmo de reconocimiento de matrículas, el input es la imagen del coche, y el output es el número de la matrícula. El machine learning es el proceso con el que el algoritmo irá mejorando para sacar un output correcto. 

Desde los orígenes de la inteligencia artificial como disciplina en el 1955, el machine learning ha ido creciendo y evolucionando. Es una técnica clave para resolver problemas de disciplinas muy diversas. Por ejemplo, con el procesamiento de imágenes y visión artificial, para el reconocimiento facial; la biología computacional, para la detección de tumores y el descubrimiento de fármacos; o en el procesamiento del lenguaje natural, para reconocimiento de voz o como traductor online. 

¿Cómo se entrena a una máquina en ‘machine learning’?

El funcionamiento del machine learning se puede entender como un proceso de aprendizaje para llegar a un objetivo

Imaginemos que unos padres quieren que su hijo aprenda qué es una manzana. El niño aprende señalando objetos y los padres le responden: sí, eso es una manzana; no, eso no es una manzana. Poco a poco el niño se irá dando cuenta de ciertas características de la manzana que le permitirán hacerlo cada vez mejor. 

El conjunto de objetos que el niño señala durante su proceso de aprendizaje, equivale al conjunto de datos que usará un algoritmo de machine learning como inputs. Estos datos pueden estar etiquetados (si ya contienen el output deseado, la respuesta correcta), o bien no etiquetados.

Este ejemplo es una forma muy simplificada de cómo pueden aprender las máquinas con el aprendizaje automático. Pero no solo hay esa, dependiendo de la tarea que se quiere realizar, se utilizan distintos tipos de aprendizaje: supervisado, no supervisado, semi supervisado o por refuerzo.

Qué es el aprendizaje supervisado

Cuando en machine learning se usan datos etiquetados hablamos de “aprendizaje supervisado” (supervised learning en inglés). En este caso, el modelo se entrena con datos que ya contienen la respuesta correcta. A medida que el modelo los va procesando, evalúa y readapta lo aprendido para así ir reduciendo el error y dar el output deseado. El supervisor, la persona que está detrás del aprendizaje, es el que añade las etiquetas (label) a los datos sin anotar.

Las limitaciones del  proceso de aprendizaje son que es lento, ya que se tienen que etiquetar los datos manualmente y de uno en uno, y es costoso, porque para conseguir buenas predicciones el modelo tiene que estar entrenado con muchos datos.

Un ejemplo que encontramos en nuestro día a día es la detección del correo spam o no deseado. El servicio de Gmail usa machine learning y, en concreto, aprendizaje supervisado, para filtrar los correos. El modelo tiene como input correos clasificados en spam o no spam. Durante el entrenamiento, aprenderá patrones que le permitirán predecir si un correo nuevo (no visto antes) es spam o no.

Lo consiguen gracias a TensorFlow, una librería pública de machine learning creada por Google, que bloquea 100 millones de correos spam cada día. Es capaz de detectar correo no deseado basado en imágenes, direcciones creadas recientemente y correos con elementos ocultos. 

Aprendizaje no supervisado

De lo contrario, cuando los datos que se introducen no están etiquetados, es aprendizaje no supervisado (unsupervised training). El algoritmo trata de detectar patrones, similitudes y diferencias para agrupar los datos clusters (grupos de datos con características similares). Tal y como indica su nombre, sin un supervisor que le diga si son correctos o no.

La ventaja es que ahorra tiempo porque los datos no tienen que ser etiquetados, como sí ocurre en el anterior modelo. Además, se reduce la posibilidad de error y de crear sesgos, que podría ocurrir cuando etiqueta un humano.

El aprendizaje no supervisado es muy útil para detectar anomalías, como los fraudes. Por ejemplo, los bancos utilizan algoritmos que detectan las diferencias entre la actividad normal de una persona y actividades fraudulentas. 

En este caso, se introduce en el modelo todo el historial de datos de los clientes: la frecuencia, el lugar, la cantidad de dinero, el momento del día… Con toda esta información, el algoritmo se entrena y detecta patrones en la actividad de los clientes. De manera que cuando estos realizan una acción que sale de lo normal, se enciende la alarma de fraude. Por ejemplo, si una persona ha realizado tres transacciones en un día, sacando mucho más dinero de lo que es habitual, la alarma de fraude se enciende. 

Aprendizaje semisupervisado en ‘machine learning’

El puente entre estas dos tipologías dentro del machine learning es el aprendizaje semisupervisado (semi-supervised learning), que usa conjuntos de datos tanto etiquetados como no etiquetados. Para que la máquina aprenda se entrena un modelo inicial con pocos datos etiquetados manualmente. Después, con el modelo que resulta del entrenamiento con aprendizaje supervisado, se inicia un proceso de aprendizaje no supervisado con los datos no etiquetados. 

Por ejemplo, el reconocimiento de voz de Meta, la empresa matriz de Facebook, WhatsApp e Instagram, implementa aprendizaje semisupervisado para mejorar su algoritmo. Etiquetar manualmente horas de audios es una tarea costosa y que requiere mucho tiempo. Sin embargo, la complejidad de los datos hace que sea necesario que un humano etiquete al menos algunos. Gracias a este aprendizaje, no hace falta tanto trabajo humano para conseguir buenos resultados, asegurándose un mínimo de fiabilidad.

Aprendizaje por refuerzo

Por último, el aprendizaje automático que hace que una máquina nos pueda ganar al ajedrez se llama aprendizaje por refuerzo (reinforcement training). Funciona con un sistema de prueba y error. La máquina guía su propio aprendizaje a través de recompensas y castigos. 

Los entornos de juegos son muy propicios a tratar datos como recompensas o castigos. En estos casos, la máquina recibe información sobre las reglas del juego con el objetivo de aprender a jugar automáticamente. Hay varias pruebas del éxito que presentan estos algoritmos. Deep Blue ganó al maestro del ajedrez Garri Kaspárov en 1997, AlphaGo derrotó a Lee Sedol en una partida de go, y hace 3 años Pluribus superó a los mejores humanos en el póker. 

El ‘machine learning’, cada vez más presente

Hace años que la inteligencia artificial está presente en nuestro día a día: al escribir un correo, hablar con Siri o Alexa, haciendo una búsqueda en Google… El desarrollo del machine learning permite resolver muchos problemas que pueden parecer cosa del futuro. En los últimos años, se han desarrollado algoritmos y modelos que desafían los retos de esta ciencia.

Vicent Adam confía en el potencial del machine learning y defiende que muchas tareas que actualmente resuelven los humanos pueden resolverse mejor en combinación con un algoritmo o solo por un algoritmo. Aun así, Adam recuerda que lo más importante es definir los objetivos y considerar el impacto económico y social. “Se puede discutir si el despliegue de esta tecnología es beneficioso para el individuo y la sociedad. Por ejemplo, se sabe que los algoritmos de las redes sociales, diseñados para maximizar el compromiso, conducen a la polarización política.”

Muchos algoritmos se crean gracias al deep learning, aprendizaje profundo en inglés, un campo del aprendizaje automático que se basa en redes neuronales artificiales. Son algoritmos inspirados en la estructura y función del cerebro humano, aunque poco tienen que ver con la biología del mismo.

Dos grandes ejemplos son CICERO, una inteligencia artificial (IA) de Meta diseñada para la diplomacia, que es capaz de negociar con otros y llegar a alianzas. Y GPT-3, una IA que utiliza deep learning para entender el lenguaje y que es capaz de escribir textos, conversar, hacer resúmenes de textos más largos, etc. Basado en este último modelo, OpenIA ha desarrollado ChatGPT, una IA capaz de mantener conversaciones, dando respuestas acertadas y completas.

En España también es una tecnología creciente. Prueba de ello es que el 41,6% de las empresas TIC han implementado algún tipo de inteligencia artificial, principalmente para el machine learning. Además, se ha puesto sobre la mesa de las autoridades españolas preparar una posible regulación de la Inteligencia Artificial, para abordar legalmente un ámbito que ya nada parece alejarse del presente. Adam, insiste en que la IA es una herramienta que se debe usar con precaución, ya que “el uso disruptivo de la IA, que causa más problemas de los que resuelve, es más peligroso que la singularidad, el irreversible momento en el que la inteligencia artificial escapa del control humano.”

Read Entire Article