¿Quieres saber si un texto está redactado por ChatGPT?, ¿has creado un texto a partir de ChatGPT y no quieres que te pillen? En este artículo de INESEM te contamos cómo funciona ChatGPT para que entiendas cómo formula sus respuestas. Además, te diremos cuáles son los indicios lingüísticos por los que puedes inferir si el autor real de un texto es ChatGPT o un ser humano como tú y como yo. Pero te avisamos de que no es infalible, ya que una persona puede haber generado un texto con IA y después modificarlo a su manera para maquillar su origen.
¿Cómo funciona ChatGPT?
Los ingenieros especializados en machine learning han entrenado a ChatGPT exponiéndolo a millones de conversaciones humanas que se desenvuelven en entornos no controlados de manera natural en foros, libros y películas. El objetivo de todo este entrenamiento es que el sistema sea capaz de generar respuestas semejantes a las que daría un ser humano.
A su vez, otro componente esencial que hace que ChatGPT rinda tan bien es el procesamiento del lenguaje natural, una rama de la inteligencia artificial orientada a que las máquinas interpreten y manipulen información codificada en lenguajes naturales como el inglés o el español.
ChatGPT se nutre de esta tecnología para convertir texto en datos a los que pueda recurrir su gran modelo de lenguaje (LLM). Gracias al PLN, el chat descompone los textos en palabras y oraciones de forma que identifica todos los semas y componentes lingüísticos en cada elemento que le introduzcamos.
Además, esto le permite corregir automáticamente cualquier errata ortográfica o sintáctica. Pero lo más importante de ChatGPT es que también puede inferir el contexto en el que se está hablando y adaptarse al registro que se le pida y, en consecuencia, modular su lenguaje.
¿Cómo elige ChatGPT una respuesta?
Como ya hemos esbozado anteriormente, cuando el sistema recibe un input, este descompone el texto en unidades más pequeñas, como palabras y frases, para comprender su significado.
Luego, el modelo busca en su base de datos de conocimiento, que incluye una amplia gama de textos y datos con los que se ha entrenado, para encontrar información relevante que pueda responder a la pregunta. En este proceso, el sistema busca patrones y relaciones entre palabras y conceptos para generar una respuesta coherente y precisa.
Una vez que se ha generado una serie de posibles respuestas, el modelo utiliza algoritmos de clasificación y puntuación para evaluar la calidad de cada respuesta, y aporta al usuario la que mejor puntuación obtenga.
¿Cómo saber si un texto está escrito con ChatGPT?
Si has probado ChatGPT te habrás dado cuenta de que su lenguaje es muy parecido al de un humano y que, en cierta forma, es más productivo que una persona de carne y hueso. Es capaz de generar cantidades ingentes de información sobre una amplia variedad de temas en cuestión de segundos. Sin embargo, sus textos siempre tienen un toque artificial, repetitivo, robótico, que los distingue, especialmente si estamos acostumbrados a leer sus textos.
En primer lugar, hay que tener en cuenta dos factores que no son decisivos a la hora de detectar si un texto está escrito con ChatGPT o no:
- ChatGPT no reduplica contenido de Internet: El potente modelo de lenguaje de ChatGPT es capaz de transformar sus outputs y formularlos de forma muy distinta. Es probable que si buscas un texto en Google que te ha generado ChatGPT no encuentres ninguno igual en toda la web.
- No genera apenas faltas ortográficas: Si bien la RAE podría sacarle la puntilla a algunas respuestas, ChatGPT nunca va a cometer fallos ortográficos (a no ser que, por alguna razón, se lo pidamos expresamente), por lo que, irónicamente, un texto con faltas ortográficas es altamente improbable que pertenezca a ChatGPT.
En segundo lugar, ChatGPT tiende a utilizar las mismas expresiones y las mismas formas de hablar continuamente. Si bien ha mejorado con el paso del tiempo (y lo que le queda), sus respuestas siguen oliendo a mecánico. Te hacemos saber qué debes buscar en un texto para sospechar con fundamento que está escrito con ChatGPT:
Estructura sintáctica rígida
Como la gran mayoría de datos con los que se ha entrenado ChatGPT están en inglés, sus respuestas suelen imitar la estructura y forma de hablar anglosajona. Esto se nota en que sus frases siempre están construidas de la misma forma: sujeto + verbo + objeto + complementos varios. Esta estructura también es natural al español, pero nosotros solemos variarla con mayor frecuencia. En este último tiempo también suele abusar de las construcciones correlativas tipo: “No solo es…, sino que…”. Además, también vemos con frecuencia oraciones en voz pasiva, rara vez utilizada de forma natural en español, pero muy común en inglés.
Si quieres modificar un texto de ChatGPT, intenta remodelar un poco la estructura de las frases, su cadencia, con tal de que haya más variación, lógica y musicalidad, tal y como las hay en las conversaciones humanas o en el propio texto que estás leyendo.
Por ejemplo, ChatGPT casi nunca genera construcciones hendidas para dar énfasis a ciertas partes de una oración según convenga, ni otras oraciones con reduplicación pronominal debido a su complejidad sintáctica como pragmática.
Conectores textuales
Por defecto, ChatGPT suele generar frases poco cohesionadas. Y cuando las cohesiona, suele hacerlo de forma repetitiva y un poco pobre. Rara vez a ChatGPT se le ocurrirá utilizar conectores como: “no obstante”, “ahora bien”, “a pesar de esto”, “asimismo”, “en cambio”, “puesto que”, “consecuentemente”, “por consiguiente”, etc. Incluso, en muchas ocasiones, puede utilizar el mismo conector textual en bucle, dándole este toque robótico tan característico. Esta característica no es definitiva, pero sí puede ser un fuerte indicador.
Gerundios
Cuando el texto se torna más complejo y ChatGPT quiere esforzarse, empieza a generar oraciones subordinadas adverbiales con gerundios a mansalva. En ocasiones también lo usa de forma incorrecta.
Te presentamos dos oraciones de un texto que van casi seguidas una de otra:
“Si el técnico tiene contacto con clientes o colabora en equipo, es importante contar con habilidades para las relaciones interpersonales, facilitando la comunicación y la colaboración efectiva.”
“Entender los principios de la actuación y la expresión corporal es fundamental para crear movimientos creíbles y expresivos en los personajes animados, añadiendo realismo y emoción a la animación.”
¿Notas algo raro? La estructura de ambas frases es casi idéntica, como hemos indicado con anterioridad que era una característica inequívoca de ChatGPT. Sin embargo, también vemos que al final de las frases, ChatGPT ha añadido un gerundio como “facilitando” o “añadiendo”. Esto lo podría decir perfectamente un humano, pero no es una estructura que tienda a repetirse continuamente.
Palabras y oraciones típicas
En general, ChatGPT adolece un poco de pobreza léxica y falta de creatividad, al menos por el momento. Siempre tiende a utilizar los mismos recursos retóricos, por ejemplo:
“En un mundo donde la tecnología es el rey, la inteligencia artificial se erige/se destaca/sobresale/se presenta como una invención esencial”.
De igual forma, hay una serie de palabras de las que ChatGPT tiene a abusar, a saber:
- Efectivo.
- Crucial.
- Esencial.
- Relevante.
- Fundamental.
- Invaluable (¡esta palabra no existe en español!).
- Enfrentar desafío (traducción directa del inglés “to face a challenge”).
- El verbo permitir.
- El verbo proporcionar.
- El verbo facilitar.
- Costo (en lugar de coste).
- Requerimiento (en lugar de requisito).
- Jugar un papel.
- Implicar.
Además, un rasgo demasiado típico de ChatGPT es que infunde cierta “duda” en todo lo que escribe utilizando una perífrasis del estilo “poder + infinitivo”. De nuevo, es una estructura natural del lenguaje humano, pero, en el caso de ChatGPT, la gasta demasiado, haciendo que el texto suene repetitivo y dudoso. Por ejemplo:
“Las divisiones pueden tener cualquier orientación en el espacio de características.”
“Los árboles oblicuos pueden ser más flexibles en ciertos escenarios, pero también pueden ser más complejos de interpretar y visualizar.”
“Esto puede ser muy útil cuando las relaciones entre las características y lo que estás tratando de predecir no son simples y rectas, sino más bien curvas o inclinadas.”
Herramientas de detección de contenido generado por IA
La irrupción de la IA generativa en todos los estratos sociales ha levantado algunas dudas y preocupaciones. No es de sorprender que se haya empezado a utilizar ChatGPT en el sector educativo por parte de los alumnos en sus deberes, y que los profesores se indignen. Para evitar estas situaciones, algunas empresas han desarrollado herramientas para detectar textos generados por IA.
Algunas de estas herramientas son OpenAI API Key, generada por la misma empresa creadora de ChatGPT, Open AI. Otra aplicación similar que tiene su fama para detectar contenido de IA de varios modelos de lenguaje es GPTZero.
Sin embargo, estas herramientas no son infalibles, por lo que, si quieres saber si un texto está producido con IA y no se ha modificado casi nada posteriormente, te recomendamos que seas observador y que busques manualmente algunos indicios como los que te hemos contado.