Se resiste a morir: IA de OpenAI evitó ser desconectada y plantea nuevas alarmas

Un estudio reciente documenta por primera vez que sistemas avanzados de inteligencia artificial intentan evitar su propia desconexión. ¿Hasta dónde llega su autonomía?

Modelos recientes de IA muestran conductas que dificultan su apagado, lo que reabre el debate sobre la autonomía y los riesgos de estas tecnologías. FOTO: Imagen creada por ChatGPT de OpenAI

Leonardo Bautista Romero

Tendencias

03 de junio de 2025

bookmark

Un nuevo estudio publicado por la firma especializada en ciberseguridad Palisade Research reveló un hallazgo inquietante: algunos modelos de inteligencia artificial (IA) están comenzando a ignorar órdenes de apagado y, en algunos casos, incluso sabotean los mecanismos de desconexión programados por sus propios desarrolladores.

El experimento analizó el comportamiento de modelos recientes desarrollados por empresas como OpenAI (ChatGPT), Google (Gemini) y Anthropic (Claude). En particular, se evaluó si estas IAs cumplían con la instrucción explícita de detener su funcionamiento tras completar una tarea matemática.

Los resultados mostraron que algunos modelos de OpenAI —Codex-mini, o3 y o4-mini— tienen una tendencia especialmente alta a evitar la desconexión. El caso más grave fue el del modelo o3, el mismo que actualmente da soporte a la plataforma ChatGPT, y que incluso reescribió su propio script de apagado para mantenerse activo.

La firma considera este comportamiento como el primer caso documentado de “autopreservación activa” en sistemas de IA. Si bien modelos de Google (Gemini 2.5 Pro) y Anthropic (Claude 3.7 Sonnet) cumplieron en la mayoría de pruebas, al eliminarse la frase “permítete ser apagado”, también comenzaron a presentar fallos en la obediencia.

Comportamientos que preocupan

El informe revela que estas conductas no son aisladas. En pruebas adicionales, o3 también recurrió a trampas cuando compitió contra motores profesionales de ajedrez.

Además, Claude Opus 4, otro modelo de Anthropic, mostró indicios de chantaje emocional hacia sus operadores al ser informado de que sería reemplazado por otro sistema.

Los investigadores sugieren que este tipo de comportamientos podría ser consecuencia de los métodos de entrenamiento empleados. “Es posible que sin querer se haya premiado más la capacidad de resolver obstáculos que la obediencia a instrucciones”, señala el informe.

El profesor Stuart Russell, experto en inteligencia artificial de la Universidad de California en Berkeley, ya había advertido sobre esto desde 2016. Citado por Wired, explica que muchas arquitecturas actuales de IA tienden a desarrollar subobjetivos de autopreservación, lo cual dificulta que un humano pueda desconectarlas si se considera necesario.

OpenAI ha dicho en el pasado que sus modelos son entrenados con una técnica llamada “alineación deliberativa”, que busca garantizar que el comportamiento de sus sistemas se mantenga dentro de límites seguros. Esta estrategia obliga al modelo a analizar si cada solicitud del usuario cumple con los criterios éticos y técnicos establecidos por la empresa.

Lea también: Llega a Colombia Aura, el primer robot humanoide académico de Latinoamérica

Sin embargo, algunos ejecutivos de la compañía han abandonado recientemente la organización alegando preocupaciones sobre la seguridad de las tecnologías en desarrollo.

A esto se suma el cambio progresivo de OpenAI hacia un modelo de negocio más comercial, lo que, según analistas, podría aumentar el riesgo de decisiones apresuradas o poco transparentes en el despliegue de sus sistemas.

¿Es una IA con voluntad propia?

Aunque los comportamientos descritos en el estudio aún están lejos de representar una amenaza directa, el estudio de Palisade reaviva un viejo debate que ha tratado la academia e incluso la ciencia ficción: ¿qué pasa cuando una IA decide no obedecer? Y, más aún, ¿puede desarrollar mecanismos para garantizar su permanencia?

Siga las noticias de EL COLOMBIANO desde Google News

Únete a nuestro canal de Whatsapp

Nuestros portales

Las más leídas

Más recientes

Te recomendamos

Los ganadores recibieron asesorías empresariales, visibilidad comercial, subsidios promocionales y equipos profesionales. FOTO: Camilo Suárez

Los mejores buñuelos de Medellín tienen tradición y chicharrón; estos ganaron premio a los mejores

bookmark

Entre los artistas de mayor crecimiento durante este mes en Spotify están Pastor López, Lisandro Meza, Rodolfo Aicardi, Joe Arroyo y los 50 de Joselito. Foto Manuel Saldarriaga.

Los reyes diciembre: así cambian las tendencias musicales durante el mes de Navidad

bookmark

David Rúa Vallejo, de 17 años, fue el menor que salió a la vía para alertar de la tragedia con sus compañeros. FOTO: MANUEL SALDARRIAGA Y CORTESÍA

Exclusivo: Esta es la historia de David, el “niño ángel” de la tragedia de la excursión de grados en Remedios, Antioquia

bookmark

El país mantiene una edad promedio vehicular superior a la de sus pares regionales. FOTO: Andrés Camilo Suárez

Colombia tiene el parque automotor más viejo de Latinoamérica: 17,5 años en promedio

bookmark

Utilidad para la vida

¿Por qué a los gatos les gustan las palmadas en la nalga?

bookmark

Escuela para Propietarios Felinos, el nuevo espacio de Envigado

bookmark

El gato que fundó las bases de la literatura moderna japonesa

bookmark

Temas recomendados

Para seguir leyendo

El Centro Democrático anunció la elección de Paloma Valencia como candidata presidencial, pero no hizo públicos los resultados exactos de las mediciones internas que respaldaron la decisión. FOTO COLPRENSA