Elon Musk, fundador de xAI, alertó sobre la disponibilidad limitada de datos del mundo real para entrenar modelos de inteligencia artificial (IA), durante una transmisión en vivo junto a Mark Penn en la plataforma X. Musk afirmó que casi se ha agotado el conocimiento humano acumulado para el entrenamiento de IA, fenómeno que, según él, ocurrió aproximadamente en 2022. Esta preocupación coincide con declaraciones de Ilya Sutskever, ex director científico de OpenAI, quien en la conferencia NeurIPS mencionó el 'pico de datos' y la necesidad de modificar las estrategias de desarrollo de modelos.
Ante esta escasez, Musk propone ampliar el uso de datos sintéticos, que son generados por los propios modelos de IA para su autoaprendizaje mediante procesos de autocalificación y mejora continua. Empresas como Microsoft, Meta, OpenAI y Anthropic ya emplean esta estrategia. Gartner estima que en 2024, el 60% de los datos utilizados en proyectos de IA serán sintéticos.
Ejemplos concretos de esta tendencia incluyen al modelo Phi-4 de Microsoft, entrenado con datos reales y sintéticos, y la adopción de la misma estrategia por Google con sus modelos Gemma. Además, Anthropic utiliza datos generados por IA para crear a Claude 3.5 Sonnet, mientras que Meta perfecciona su serie Llama con esta metodología.
El uso de datos sintéticos también implica considerables ahorros: el modelo Palmyra X 004 de la startup Writer fue desarrollado casi exclusivamente con datos generados artificialmente, reduciendo costes a aproximadamente USD 700,000 frente a los USD 4.6 millones estimados para un modelo similar entrenado con datos reales.
Sin embargo, expertos advierten de los riesgos asociados, como el 'colapso del modelo', en el que la IA pierde creatividad y se vuelve más propensa a reproducir sesgos, limitando su utilidad en tareas complejas. Los sesgos presentes en los datos sintéticos pueden transferirse a los modelos, poniendo en riesgo su desempeño en situaciones reales.
En un contexto de avances y desafíos, Musk en sus intervenciones en el Foro Económico Mundial de Davos 2026 sugirió que, para finales de ese año, la programación tradicional quedará obsoleta. Predice que la IA será capaz de interpretar instrucciones en lenguaje natural y generar soluciones automáticas, lo que dejará atrás la necesidad de escribir código línea por línea. Musk expresó que en un futuro cercano, describir lo que se desea lograr será suficiente para que los modelos generen los archivos ejecutables necesarios, cambiando radicalmente el panorama laboral en tecnología.