Gemini o ChatGPT
Al principio todo era aprendizaje supervisado, es decir, el humano etiquetaba los datos de aprendizaje. había que decirle la probabilidad de aparición de cada palabra. Se usaban con mucha eficiencia en la predicción. Uno de los mayores desarrolladores y usuario de este aprendizaje fue Amazon (2010). Su IA era capaz de predecir la demanda y convirtió la logística y su organización de almacén en toda una revolución. Se le unió los robots Kiva como “mozo de almacén” (visión artificial y conducción automática) que por cierto es una versión de los robots de la empresa española ASTI, cuyo CEO es Verónica Pascual. Sus robots están por todo el mundo #VisibilidadStem
Llegamos a 2017 y un estudio desarrollado por Google llamado “Lo único que necesitas es atención”, propone una nueva arquitectura para la IA (trasformadores) basada en la atención. Gracias a esta tecnología la IA puede concentrarse en las partes relevantes del texto produciendo textos sensibles al contexto. Toda la atención que no tiene el alumnado, la tiene la IA, al final es verdad que nos domina… 😉.
La IAGen (modelos de frontera) funciona realmente como el autocompletar del móvil, predice la palabra siguiente. La ventaja del sistema transformer es que no necesita los datos etiquetados por humanos (que somos muy lentos). A la IAGen se le dan millones de datos y a fuerza de leer y analizar obtiene los pesos, es decir, la relación que existe entre las palabras, se etiqueta ella misma. La IA aprende a reconocer patrones, estructuras, cuantos más le das mejores pesos tiene y mejor escribe.
La IA funciona como nuestro cerebro, por patrones, hemos diseñado una IA que funciona como nosotros y ahora nosotros queremos pensar como ella y nos inventamos esto del pensamiento computacional. Esto empieza a ser más filosofía que otra cosa. 😂😂😂
🧠¿Cuáles son los datos de entrenamiento?
Se entrenaban con datos públicos así que se usaron todas las novelas románticas escritas por afición que existen en las redes (para horror de nuestro equipo de Biblioteca). También se entrenan con libros con derechos de autor, por supuesto sin pedir permiso, como solo se usa para crear pesos no infringe la ley (supongo que habrá que cambiar la ley). Y no olvides que si una misma obra aparece mucho en los datos de entrenamiento al generar contenido deja de ser una versión y empieza a ser una copia. Se calcula que los últimos datos de calidad para entrenamientos se van a terminar el 2026. Para entrenar, para generar la respuesta usa todo lo que encuentra por Google,
Se calcula que a finales de 2026, el 90% del contenido de Internet podría ser generado sintéticamente. Actualmente se considera que el 50% de lo publicado ya es slot (basura digital, generado por IA)¿Se está entonces entrenando (ya) con material que ella misma ha generado?. Esto puede provocar lo que se llama "colapso del modelo", donde la información se degrada y se vuelve repetitiva y llena de errores, igual que una fotocopia de una fotocopia.
Si os gustan las teorías conspiranoicas os recomiendo la teoría de la internet muerta en la que se expone que la mayor parte de la actividad en Internet (votos, comentarios, artículos, vídeos) ya no es humana, sino bots interactuando con otros bots.
🧠 Y cuando ya está preentrenada?
Una vez que la IA está preentrenada se pasa al “ajuste fino” aquí entran los humanos. Los humanos entrenan a la IA para evitar amenazas, consejos de autolesiones… hay personas de países en desarrollo que están expuestos a un contenido generado que nadie debería ver, igual que los limpiadores de las RRSS, filtran todo.
En definitiva el humano penaliza esas respuestas y así se consigue la versión comercial del chatbot, mucho menos desquiciada. También la recompensa por generar buenos resultados.
Es el conductivismo de Skinner en “artificial”. La IA quiere hacerte feliz