Frédéric Kaplan para Le Monde Diplomatic / 29 de julio de 2025
Identificar el texto generado por ChatGPT o cualquier programa equivalente es un desafío diario para profesores, editores y periodistas. Una solución es detectar las formas lingüísticas recurrentes que utilizan estas herramientas. Estructuras cuya omnipresencia podría alterar la diversidad lingüística.
Una ritmicidad singular se impone, de forma discreta pero generalizada, en muchos textos producidos y difundidos en el universo digital. Se encuentra en redes sociales, entradas de blogs y, a veces, incluso en artículos de prensa, en inglés, francés y muchos otros idiomas.
Esta nueva » firma » se basa en el uso recurrente de dos recursos estilísticos básicos. El primero consiste en vincular dos frases con significados contrastantes, según una estructura como: » No es esto, es más bien aquello «, o » No es solo…, sino que también es… «. Uno establece una expectativa, una hipótesis o una creencia ; el otro la invierte. Llamemos a este recurso » díptico pivote «.
La segunda estructura se basa en un ritmo ternario: una secuencia de tres cláusulas que se amplifican o complementan entre sí. Puede consistir en tres verbos, tres oraciones cortas o un ascenso gradual en tres etapas hacia una idea más densa: « Es un sistema que constriñe, refuerza y cierra ». Llamémoslo simplemente « tríptico rítmico ».
Aquí, por ejemplo, hay una secuencia compuesta por dos dípticos fundamentales: « Figuras como Sam Altman, Elon Musk o Peter Thiel no solo dirigen empresas tecnológicas ; moldean activamente las políticas públicas y las visiones del futuro. Su poder no reside solo en su riqueza, sino en su capacidad para definir lo que se percibe como inevitable o deseable » . Este extracto proviene de un texto generado por el modelo de lenguaje GPT-4o utilizado por ChatGPT, en respuesta a la siguiente instrucción: « Escribe una entrada de blog basada en el contenido de un artículo de Evgeny Morozov, enlazado aquí ( 1 ) » . Estas frases, por supuesto, no aparecen en el texto original, que no contiene ningún díptico fundamental.
Si repetimos la solicitud, el nuevo texto generado por GPT incluye un díptico fundamental desde la primera frase y, unas líneas después, un tríptico rítmico: « Ya no se conforman con financiar la innovación. Quieren escribir la historia. Y no cualquier historia: la suya propia. En Silicon Valley, una nueva generación de actores se está imponiendo en el debate intelectual global: los oligarcas intelectuales. ¿Su ambición ? Redefinir lo que significa vivir, trabajar, pensar… en la era de la inteligencia artificial » . Una tercera versión de la publicación incluye un díptico fundamental que, a su vez, incluye un tríptico rítmico: « No se trata de rechazar de plano toda idea que surja en el ámbito tecnológico. Sino de reintroducir el pluralismo, el debate y la disidencia » . Cualquiera puede repetir fácilmente este sencillo experimento y comprobar por sí mismo la presencia constante de estas dos figuras estilísticas en la mayoría de los textos generados.
Estas estructuras pueden resultar familiares, como progresiones de acordes que se escuchan desde la infancia. Resuenan como un eslogan y se graban en la memoria. « No es el destino lo que importa, sino el viaje », « Llegué, vi, conquisté ».
Sus orígenes se remontan al menos a la retórica latina. Cicerón, por ejemplo, analiza el uso de estructuras compactas y simétricas que alternan oposiciones de tesis/antítesis y enumeraciones ternarias llamadas « tricolones ». El díptico fundamental y el tríptico rítmico ya constituyen una gramática estilística mínima en la Antigüedad, capaz de organizar discursos breves y contundentes. Uno crea un cambio narrativo ; el otro implementa un aumento de intensidad.
Homogeneización formal
En las plataformas digitales, algunos textos se construyen casi en su totalidad a partir de estos dos esquemas. Como si provinieran de un procedimiento combinatorio basado en un conjunto restringido de operaciones: una introducción en ritmo ternario, seguida de un díptico fundamental, vinculado a su vez a un segundo díptico cuya conclusión integra un nuevo tríptico, y así sucesivamente. Esta sistematicidad mecánica constituye un indicador fiable de la generación algorítmica. Pues dicha homogeneización formal se deriva del propio proceso de aprendizaje de modelos lingüísticos, basado en la compresión estadística de vastos corpus textuales para optimizar la predicción de secuencias subsiguientes. Esta técnica tiende a producir formas lingüísticas recurrentes —denominadas « atractores »— a las que la máquina regresa espontáneamente.
A estas alturas de nuestro conocimiento, sigue siendo un misterio cómo la compresión y el procesamiento estadístico de las masas textuales utilizadas para el aprendizaje harían resurgir estas formas de retórica, como si la influencia de la oratoria latina hubiera sido redescubierta por el modelo en miles de millones de extractos, una estructura subyacente, invisible pero fundamental en el orden del discurso, hoy utilizable como plantilla para generar textos calibrados para interesar al lector.
La ausencia de estas figuras, obviamente, no garantiza el origen humano de un texto. Es fácil forzar un modelo lingüístico a evitar los atractores más visibles, por ejemplo, prohibiendo el uso de dípticos pivotales o ritmos ternarios. Pero esto solo desplaza el problema: la secuencia producida recurre espontáneamente a otros atractores, simplemente menos frecuentes. Ningún texto que pase por un modelo lingüístico escapa a la influencia de los paisajes estadísticos.
Esta regularización del lenguaje era previsible. Resulta de la lógica económica de acumulación, modelado y mediación propia del capitalismo lingüístico ( 2 ) . El hecho de que podamos identificar a simple vista estas dos figuras, ciertamente anecdóticas en sí mismas, quizás atestigua un proceso de recomposición textual a gran escala.
El fenómeno resulta aún más preocupante dado que los textos generados se utilizan ahora para entrenar futuros modelos lingüísticos. Estos pronto dejarán de alimentarse principalmente de recursos primarios producidos por humanos, para integrar una proporción creciente de textos contaminados por la intervención de otros modelos. Este bucle amplificará así formas y ritmos específicos, guiando la evolución de los idiomas, iteración tras iteración, hacia un destino profundamente incierto.
Comienza una carrera contrarreloj: identificar la firma de estos textos lo antes posible para excluirlos de futuros conjuntos de datos de entrenamiento, un ejercicio al que los propios modelos lingüísticos pueden contribuir. Y, además, descubrir otros patrones, más discretos pero igualmente estructurantes, subyacentes a los textos generados. Como escribiría GPT: no es solo una cuestión de retórica, es un desafío para la diversidad, el lenguaje y el pensamiento.
Federico Kaplan
( 1 ) Evgeny Morozov, « Los intelectuales-oligarcas, los nuevos legisladores de Silicon Valley », blog Silicon Circus, 14 y 17 de abril de 2025, www.monde-diplomatique.fr
( 2 ) Leer “ Cuando las palabras valen oro ”, Le Monde diplomatique, noviembre de 2011.





Users Today : 50
Total Users : 35464632
Views Today : 108
Total views : 3430061