Los 6 mejores algoritmos de inteligencia artificial que debes saber
Te hablo sobre los algoritmos mas usados en machine learning
Últimamente he estado dando clases a mis alumnos sobre los modelos de machine learning.
Y claro, mucho data science por aquí pero todavía no he hablado de la biblia del machine learning: los algoritmos.
Hoy te enseñaré cuáles son los 6 algoritmos más usados por las empresas.
Si te gusta lo que lees, te dejo por aquí este botón, es gratis e inofensivo:
También te quiero pedir algo especial al final. Me servirá mucho a mí, pero también habrá algo para ti cuando respondas. Vamos al tema:
1. Regresión lineal
El modelo rey por excelencia.
A ver, también te digo que no voy a ponerme matemático ni exquisito mientras hablo de estos algoritmos. Mi intención es que los conozcas. Si quieres, puedo preparar un video con cada uno enseñando código y hablando más en profundidad.
Este es el algoritmo por el que todos deberíamos empezar.
Nos sirve para ver la relación entre varias variables predictoras y la variable a predecir.
Trata de buscar la mejor línea combinación de nuestras variables para predecir nuestros datos. También se puede ver como buscar la mejor línea recta que se ajuste a nuestros datos.
Pongamos un ejemplo: queremos predecir el precio de una casa en función del numero de habitaciones, del tamaño y de la antigüedad. Pues crearemos una formula matemática que funcionará como: 4 habitaciones por 50.000 + 80 m2 por 2000 + … igual a X precio.
Así, de una forma muy sencilla, podemos predecir el precio de todas las casas.
Pros:
Sencillita, muy fácil de interpretar y fácil de implementar. Todo el mundo entiende una fórmula.
Contras:
Vulnerable a outliers y asume que todo es lineal, y, en el mundo real, nada es lineal.
2. Regresión logística
A ver, si eres un entendido de esto, sabrás que aquí estoy haciendo algo de trampas.
La regresión logística es el mismo algoritmo que el anterior.
Pasemos al siguiente modelo de inteligencia artificial:
Es broma. A ver.
Antes te he puesto un ejemplo para predecir el precio de una casa. El precio puede variar entre 50.000 e… Infinito? Y claro, necesitas una fórmula que al introducir muchos valores te devuelva un resultado numérico.
Pero, ¿Qué pasaría si no quiere predecir un resultado numérico? ¿Qué ocurriría si quiero predecir si una persona va a cometer fraude o no?
Aquí el problema cambia radicalmente. Solo tengo dos posibles resultados: Sí o no. Si me apuras, pueden haber: sí, no y tal vez. Pero aquí hay mucho más en lo que no me detendré.
Ahora hay que mirar el problema desde otro prisma diferente: el mundo de la clasificación. Y las reglas cambian.
Así que, si ya te lo estas oliendo, sí, la regresión logística es el mismo algoritmo que el anterior, pero esta vez predice la probabilidad de que cometas fraude o no.
También es el algoritmo más usado en la clasificación. Por exactamente los mismos motivos que antes.
No se si eres consciente de esto, pero acabas de aprender un asunto clave en el mundo del data science: la diferencia entre la regresión y la clasificación.
3. Redes neuronales
Oh sí. Aquí la cosa se empieza a poner interesante.
Hasta ahora me puedes decir: vale Javi, pero todo esto son fórmulas matemáticas, donde esta la inteligencia artificial? Ahora te lo digo.
Aquí, con las redes neuronales, es cuando empezó todo.
Unas personas decidieron crear unas fórmulas matemáticas ultra complejas para imitar la forma de pensar del cerebro humano. Y lo consiguieron.
Digamos que las redes neuronales son muchas regresiones lineales (miles, de hecho) que aprenden mucho mejor datos que no siguen una forma lineal.
Por ejemplo, podemos entrenar una red neuronal para adivinar qué flor estamos viendo. O para entender qué persona está hablando.
Son tareas que van más allá del 1 + 2 = 3.
Las empresas usan estos algoritmos para multitud de tareas. A bote pronto, te digo: El traductor de google es una red neuronal (te he contado alguna vez que trabajé con una chica que había creado mejores traductores que el de google?). ¿Y el detector de spam de google? También es otra red neuronal.
Y para que me sirve a mi? Bueno, yo hice una red neuronal que usaba la capacidad de 4 redes neuronales famosas y potentes para predecir flores.
La hice en un proceso de selección para data scientist en Madrid. Y me dieron la oferta de trabajo.
Pros:
Aprenden patrones que son difíciles de captar con otros modelos. Se suele usar en datos no estructurados y su potencial es casi infinito.
Contras:
Son costosas, necesitan muchos datos para funcionar bien. Y lo peor, intenta explicar lo que está haciendo esta red. Son casi inexplicables. hay que usar procesos avanzados para su explicabilidad.
Bueno, esto está quedando un poco largo. Voy a dejarlo por aquí y sigo dentro de 2 semanas con los otros 3 modelos que faltan. Ahora te pido ayuda.
Estoy creando unos cursos de programación. Entre ellos tengo: introducción a python, numpy y pandas y data science.
Lo que necesito de ti es que me digas que te interesa más de este mundo. Prefiero hacer un curso hablando de algo que te interese, que hacer un curso super interesante que no te sea tan interesante en verdad.
Así que, si quieres, te agradecería con todo mi corazón que me digas en lo que estás interesado, sea cual sea tu nivel en programación.
Y también te lo agradezco con un código personal para recibir un descuento en un curso. Valoro tu tiempo al escribirme tu sugerencia.
Espero que te haya gustado. No dudes en enviarme un mensaje contándome sobre ti, sobre qué haces, qué te gustaría leer o qué has comido hoy.
Si así ha sido, comparte mi newsletter con un amigo tuyo interesado en programación, data science, data engineering o el mundo empresarial.
Nos leemos.
JaviDS
Sígueme en youtube para ver cosas guays: https://www.youtube.com/@javidatascience