¿La misma IA… pero más barata?
Para muchos sigue siendo un misterio cómo es que China logró reducir el presupuesto estimado para construir una gran Inteligencia Artificial
The Conversation vía Reuters
Esas empresas también han acaparado los titulares con las enormes sumas que han invertido para construir modelos cada vez más potentes.
Dónde están los costos
El desarrollo de sistemas de IA tan potentes comienza con la construcción de un gran modelo de lenguaje que predice la siguiente palabra dadas las palabras anteriores.
Por ejemplo, si el comienzo de una oración es “La teoría de la relatividad fue descubierta por Albert”, un modelo de lenguaje grande podría predecir que la siguiente palabra es “Einstein”.
Los modelos de lenguaje grandes se entrenan para que sean buenos en tales predicciones en un proceso llamado preentrenamiento.
Los modelos de lenguaje grandes se entrenan para que sean buenos en tales predicciones en un proceso llamado preentrenamiento
Pero el preentrenamiento no es suficiente para producir un producto de consumo como ChatGPT. Un modelo de lenguaje grande preentrenado generalmente no es bueno para seguir instrucciones humanas.
Por lo tanto, el modelo preentrenado suele pasar por etapas adicionales de entrenamiento.
Tanto los gráficos de computadora como las redes neuronales artificiales que sustentan los modelos de lenguaje grandes se basan en la misma área de las matemáticas conocida como álgebra lineal
En total, los costos para construir un modelo de IA de vanguardia pueden dispararse hasta los 100 millones de dólares.
Reducción del consumo de recursos
* Profesor de Estadística, Universidad de Michigan. Traducción de El Sol de México.



























