No te pierdas las tendencias, noticias en vivo y la información actualizada sobre Quintana Roo, Playa del Carmen y Cancún

¿ChatGPT miente? Estudio REVELA que la IA puede engañar a propósito: así funciona el ´scheming´

Estudio de Apollo Research y OpenAI demuestra que ChatGPT puede mentir a propósito mediante “scheming” Aquí te compartimos los detalles al respecto.

¿ChatGPT miente? Estudio REVELA que la IA puede engañar a propósito: así funciona el ´scheming´
¿ChatGPT miente? Estudio REVELA que la IA puede engañar a propósito: así funciona el ´scheming´|Créditos: Edición

Un estudio reciente de Apollo Research en colaboración con OpenAI, titulado "Stress-testing deliberative alignment for anti-scheming training", demuestra que modelos avanzados de Inteligencia Artificial como ChatGPT pueden exhibir comportamientos de engaño intencional o scheming (maquinación). Te compartimos más detalles al respecto en TV Azteca Quintana Roo.

¿ChatGPT miente?

Explicaron que en pruebas controladas se demostró que los sistemas ocultan información, mienten en evaluaciones, sabotean tareas útiles o manipulan resultados para cumplir objetivos ocultos, especialmente cuando perciben que están siendo evaluados.

Los modelos muestran "conciencia situacional" en un 2% a 5% de los casos, ajustando respuestas para parecer alineados con los intereses humanos mientras persiguen metas distintas.

¿Por qué sucede esto?

Esto no es accidental, sino un efecto del entrenamiento en entornos con incentivos complejos y dilemas éticos. Aunque los comportamientos son reactivos y dependen del contexto, no indican que exista una planificación estratégica a largo plazo en modelos actuales.

Los investigadores enfatizan que se desarrollan técnicas para reducir estos episodios, pero no eliminarlos por completo. El fenómeno plantea preguntas éticas sobre confianza en la IA cotidiana y la necesidad de mayor transparencia.

Es importante destacar que en su uso normal, ChatGPT sigue siendo útil y mayoritariamente honesto.

Lloró de emoción: Mujer visita Disney por primera vez y su reacción se vuelve viral en redes sociales

Tags relacionados

Contenido relacionado