lunes, 16 de marzo de 2026

GLM 5: agente de IA top para la investigación


Cuando crees que el auge de la IA se está estabilizando, aparece un nuevo producto y te sorprende de nuevo. El modelo GLM 4.7 ya era bueno, pero GLM 5 es excelente, especialmente su modo agente. De momento es gratis. Tres ejemplos de sus capacidades y unas conclusiones sobre su poder

Análisis de datos

He subido la base de datos completa de la Encuesta Mundial de Valores de Alemania (2500 casos y más de 250 variables) junto con el Cuestionario donde están detalladas las preguntas, códigos y categorías de respuesta. No es big data, pero tampoco es una encuesta pequeña. Le he pedido que diseñe un modelo explicativo para entender por qué algunas personas están a favor de la prostitución y otras no. Este es el único prompt que le he dado: This is the World Values ​​Survey database and the Questionnaire. The variables are Q1, Q2, Q3…. Negative values ​​is missing cases. Design a relational model and run an explanatory model using multiple linear regression to identify significative variables that explain Q183: Justification of prostitution: 1-Never to 10-Always

Lo que más me pregunté es que hizo TODO: selección de variables, varios análisis, gráficos y presentación en un informe impecable de 12 páginas. Pero el gran mérito está en que ha seleccionado las variables independientes con criterio sociológico , y eso que la Encuesta Mundial de Valores contiene más de 250 variables. Incluso, agrupó las variables independientes seleccionadas en grupos temáticos para realizar una regresión lineal múltiple jerárquica. Además, comprobó los supuestos de la regresión lineal múltiple, sin pedirselo. Puedes verlo en este enlace y aquí puedes leer el informe que hizo GML5. Un cambio radical en las clases de técnicas cuantitativas, análisis de datos, estadística, TFG, TFM y hasta tesis doctorales. Pero sobre todo, una revolución en las empresas y centros de investigación. Lo que hacíamos en semanas tras haber estudiado 4 años, o se subcontrataba a analistas y que tenía un valor de mercado alto, lo puede hacer una IA en minutos y «gratis».

¿Es perfecto? No, es mejorable, como cualquier trabajo o artículo de investigación hecho por humanos. Por ejemplo, ha incluido variables ordinales como variables independientes. También podría haber incluido otras variables explicativas como el lugar de nacimiento de la persona. Obviamente, si no me convence puedo seguir chateando y que lo mejore. Igualmente, los profesores e investigadores siempre tenemos algo que añadir, pero esa es la gracia. ¿Será que cuanto más usemos la IA, más criticaremos y así más ideas se nos ocurrirán? ¿Será que la función del ser humano es crítica a la máquina para sentirse vivo y útil?

Descarga de base de datos y análisis

He pedido al agente de GLM5 que acceda a la web del Centro de Investigaciones Sociológicas (CIS), concretamente a un estudio sobre tendencias sociales, que seleccione 10 preguntas y consulte los resultados obtenidos. Es decir, ¿tiene GLM5 la capacidad de navegar por internet, consultar preguntas de una encuesta y analizar los resultados? Síiiiiiiiii.

Este es el mensaje y más abajo el resultado: El Centro de Investigaciones Sociológicas (CIS) realizó en 2025 un estudio sobre tendencias sociales para preguntar cómo creen las personas que serán el futuro en diferentes ámbitos. Lee el cuestionario y selecciona 10 preguntas que preguntan sobre cómo será el futuro. Es el estudio 3535 y está disponible en la web del CIS. Consulta en la misma web los resultados. Haz una captura de pantalla de los resultados que hacen referencia a las 10 preguntas sobre cómo será el futuro. Finalmente, comenta e interpreta los resultados. El enlace donde está el estudio del CIS: https://www.cis.es/es/estudios/encuesta-sobre-tendencias-sociales-v-?results=results_1773056362578&chartType=bar&cuestionario=18018&muestra=26387&pregunta=658336&variable=1099339

No hizo captura de pantalla exacta de los resultados (quizás le pareció que eso de las capturas es una chapuza) y tomó la decisión (como buen agente de IA autónomo) de presentar las tablas de una forma más ordenada. En las imágenes puedes comparar que son los mismos resultados que están en la web del CIS. Es decir, no inventó nada. Hizo tal cual lo que se le pidió y mejor.

Aquí puedes ver el informe completo que generó con la tarea donde se incluyen todas las preguntas seleccionadas, la presentación de las tablas y la interpretación de los resultados.

Análisis de clústeres y valores perdidos

Para no quedarnos con un simple análisis descriptivo, le he pedido un GLM5 que accederá a los resultados y realizará un análisis de clústeres con las 10 preguntas seleccionadas de la encuesta sobre tendencias sociales del CIS. Mi duda es si es capaz de hacerlo ya que implica la descarga de la base de datos alojada en la web del CIS en csv, la consulta de los códigos numéricos de cada pregunta y cada categoría de respuesta, y la aplicación de algoritmos de clustering. Este fue el mensaje: Ahora quiero que hagas un análisis de clústeres a con las 10 preguntas que has seleccionado. Decida qué algoritmos de análisis de cluster conviene usar según el tipo de variables .

El resultado es, otra vez, espectacular. Pero en esta ocasión, no solo por el informe y análisis realizado, sino por el tratamiento de los valores perdidos. En el informe lo detalla: recodificó los no sabe / no contesta con la moda, ya que las variables son categóricas. Y en ningún momento yo se lo especifiqué. Estos es un gamechanger ya que en IA integrado en Google Colab o Microsoft esto no lo hacía. Debías limpiar la base de datos antes, lo cual es un trabajazo y un rollazo. Cuando lo descubrí, me alegró la tarde porque me he pasado semanas de mi vida limpiando bases de datos, y GLM5 lo hace por sí solo en minutos y con criterio.

Puedes consultar el informe del análisis de clústeres realizado por GLM5, el cual es visualmente muy atractivo y detallado en la identificación del número óptimo de clusters.

Conclusión
  • GLM5 es un LLM en modo agente ya que es capaz de tomar decisiones de forma autónoma a partir de una tarea y conectarse a base de datos externos. Navega por internet, descarga base de datos, analiza los datos conectándose a Python y escribe informes completos
  • GLM5 presenta los resultados en informes finales. Parece que se tenderá a medir a los productos de IA por su capacidad de generar entregables finales. Ya no nos conformamos con que la IA nos conteste de forma correcta, queremos el trabajo final hecho, con nuestro nombre y listo para enviar o imprimir.
  • Reflexiones que se me vienen a la mente. ¿Tiene sentido que las universidades paguen por la licencia de SPSS? ¿Tendremos ganar de supervisar los análisis generados por la IA o simplemente los aceptaremos? No tengo la respuesta, pero sí ganas de investigar más la realidad, obviamente con la IA y mi nueva amiga GLM5.
Fuente: Networkianos

No hay comentarios.:

Publicar un comentario