En lo que respecta a los modelos de lenguaje, la atención casi siempre se centra en alucinaciones: fechas inventadas, citas inexistentes o referencias incorrectas. Un nuevo artículo del investigador italiano Filippo Lubrano (fundador de la startup de realidad virtual y aumentada Metaphora y miembro de H-Farm) traslada el enfoque a un nivel diferente: el del estilo. El análisis demuestra que los LLM no solo cometen errores factuales, sino que tienden a reproducir un ritmo lingüístico recurrente que los delata: se trata de la figura retórica de la epanortosis enfática, la corrección inmediata que adopta la forma «no X, sino Y».
En los textos humanos, la figura tiene un significado preciso: sirve para revertir una expectativa, intensificar un concepto o introducir un giro retórico. Sin embargo, en los textos generados por modelos de IA, se convierte en una especie de tic narrativo, tres veces más común que en la escritura humana. Las cifras hablan por sí solas: en las respuestas de ChatGPT y Claude, hay un promedio de 27 ocurrencias de esa forma por cada mil oraciones, en comparación con 5 en los textos humanos y 9 en los conjuntos de datos de entrenamiento. Esta tendencia imperfecta corre el riesgo de aumentar el contenido inexacto publicado por los bots y, en consecuencia, reducir la calidad de la información disponible en la web.
¿Qué es la epanortosis enfática?
En general, el funcionamiento de la epanortosis es simple, casi mecánico. Algunos ejemplos de oraciones caracterizadas por esta característica son: ‘No es solo un café, es energía líquida’ o ‘No es un apagón técnico, es la señal de una red frágil’. La estructura da la impresión de claridad e incisividad, pero por esta misma razón, tiende a usarse en exceso. En textos humanos, parece resaltar una excepción o un matiz; en modelos de lenguaje, se convierte en un atajo estilístico que aparece en casi todas las respuestas de cierta longitud, especialmente en las transiciones de tema. Una regresión logística realizada en los resultados confirmó que la epanortosis es un predictor significativo del texto generado: cuando su frecuencia aumenta más allá de cierto umbral, es muy probable que el contenido no sea de origen humano.
La explicación reside en la intersección del entrenamiento y la optimización. En los conjuntos de datos que alimentan los LLM, las fórmulas de negación seguidas de reversiones positivas son comunes en sectores como el marketing, la autoayuda y la comunicación política. Estos textos buscan ser memorables y persuasivos. A esto se suma, explica Lubrano, el efecto del aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF, por sus siglas en inglés): los anotadores, encargados de evaluar la calidad de las respuestas, tienden a recompensar los pasajes percibidos como claros, asertivos y reforzantes. Por lo tanto, la epanortosis enfática no solo se vuelve frecuente, sino que también se refuerza artificialmente mediante el proceso de entrenamiento.
Lubrano denomina a este fenómeno el ‘efecto eslogan’: una claridad aparente que, en realidad, reduce la variedad expresiva. En lugar de aportar nuevos matices, las plantillas repiten el mismo patrón binario, replicando el lenguaje de la publicidad y los titulares clickbait.
El riesgo del lenguaje plano
El problema no es estético, sino cultural. Si los usuarios leen continuamente textos que funcionan según el patrón “no… pero…”, terminan internalizándolo y usándolo ellos mismos. Esto alimenta un círculo vicioso: los modelos lo aprenden de la web, lo amplifican y lo transmiten a los usuarios, quienes, a su vez, lo incorporan al contenido en línea, fortaleciendo aún más los futuros conjuntos de datos. El resultado es un lenguaje digital más plano, dominado por dualismos y eslóganes, que reduce las posibilidades expresivas y anula las alternativas retóricas.
El estudio señala que esta dinámica no se limita al inglés: un muestreo preliminar muestra que el mismo exceso también aparece en español, francés, mandarín y árabe. Esto indica que la epanortosis podría convertirse en una especie de universal de la escritura generada artificialmente. Para contextualizarlo, Lubrano recuerda la retórica clásica, desde Quintiliano hasta Lausberg, donde la epanortosis se definía como una herramienta de intensificación y clarificación, para su uso específico. Ahora, gracias a la IA, podría convertirse en un fenómeno generalizado que contribuya a disminuir la eficacia de lo que leemos en línea.
Cuidado con la basura de la IA
Según Lubrano, el fenómeno puede contenerse. Entre las estrategias propuestas se encuentran la inserción de múltiples textos en los conjuntos de datos que utilizan diferentes formas de énfasis (metáforas, comparaciones, cláusulas de concesión), la modificación de los modelos de recompensa para penalizar la repetición de patrones y el fomento de que los ingenieros de pronta solicitud soliciten explícitamente soluciones alternativas. No se trata de eliminar la epanortosis (sigue siendo una figura retórica útil), sino de restaurarla como una elección consciente, en lugar de un valor algorítmico predeterminado.
El mensaje final del artículo es claro: centrarse únicamente en las alucinaciones es la mitad del camino recorrido. Los LLM modelan no solo el contenido, sino también la forma. Y cuando una forma retórica se convierte en un exceso estructural, corre el riesgo de cambiar nuestra forma de leer textos artificiales, así como nuestra forma de escribir. Es en este contexto que también se desarrolla el debate cultural en torno al término “IA slop” (“basura de IA”), concretamente los cada vez más frecuentes errores en línea de la inteligencia artificial: una etiqueta que denuncia el aplanamiento lingüístico producido por estos automatismos y que hoy se convierte en clave para comprender la relación entre la IA y el estilo. Porque los modelos pueden ayudarnos a escribir, pero su contribución no siempre es positiva.
Artículo publicado originalmente en WIRED Italia. Adaptado por Mauricio Serfatty Godoy.