El gobierno de Estados Unidos entregó esta semana a Anthropic una directiva de control de exportaciones que le ordena suspender el acceso a sus modelos de inteligencia artificial Fable 5 y Mythos 5 para cualquier ciudadano extranjero, sin importar si se encuentra dentro o fuera del país, incluidos los propios empleados extranjeros de la compañía. El efecto práctico fue inmediato: la empresa tuvo que desactivar ambos modelos para la totalidad de sus clientes en el mundo.
La orden llegó el mismo día viernes 12 de junioa las 5:21 p.m. hora del Este. Según Anthropic, la carta oficial no entregó detalles sobre la naturaleza exacta de la preocupación de seguridad nacional, aunque la compañía señaló tener entendido que el gobierno cree haber identificado un método para eludir las protecciones de Fable 5, lo que se conoce en el ámbito técnico como «jailbreak».
Esto no es una sorpresa total. Como informó La Voz de Maipú hoy, Fable 5 fue vulnerado apenas 48 horas después de su lanzamiento público por el investigador conocido como «Pliny the Liberator», quien publicó capturas de cómo extrajo del modelo instrucciones para ciberataques y síntesis de sustancias peligrosas.
Lo que el gobierno mostró — y lo que Anthropic respondió
Anthropic revisó una demostración de la técnica específica citada por las autoridades y concluyó que involucra una cantidad reducida de vulnerabilidades ya conocidas, de carácter menor. La empresa sostiene que esos mismos resultados pueden obtenerse con otros modelos disponibles públicamente en el mercado, sin necesidad de ningún tipo de bypass.
Según la compañía, la evidencia concreta que el gobierno les entregó de forma verbal describe un potencial jailbreak acotado y no universal, que en la práctica consiste en pedirle al modelo que lea un repositorio de código y corrija sus fallas. «Hemos validado que el nivel de capacidad que ahí se muestra está ampliamente disponible en otros modelos, incluido GPT-5.5 de OpenAI, y es el mismo tipo de análisis que utilizan a diario los profesionales de ciberseguridad que defienden sistemas», indicó la empresa en su comunicado.
Anthropic también aclaró que hasta ahora no ha recibido evidencia de un jailbreak universal —es decir, uno que permita eludir de forma generalizada todas las protecciones del modelo— y que los hallazgos divulgados corresponden a respuestas benignas o a descubrimientos menores que no suponen un riesgo específico vinculado a Mythos.
La estrategia de defensa en profundidad
La empresa defendió públicamente el enfoque de seguridad que adoptó para Fable 5. En lugar de buscar una resistencia perfecta a los jailbreaks —que califica de imposible para cualquier compañía del sector—, apostó por una estrategia de capas que combina la reducción del alcance de cada ataque con monitoreo permanente para detectarlos y neutralizarlos rápidamente.
Parte de ese diseño fue una política de retención de datos de clientes por 30 días, medida que, según reconoció la propia Anthropic, genera costos reales en su relación comercial con clientes, pero que les permite investigar y bloquear técnicas de evasión en cuanto aparecen.
«Creemos que la resistencia perfecta a jailbreaks no es posible hoy para ningún proveedor. Dijimos esto con claridad cuando lanzamos Fable 5», señaló la compañía, argumentando que su estrategia hace que los riesgos de Fable 5 sean comparables a los de otros modelos ya desplegados masivamente en la industria.
Cumplimiento a regañadientes
Anthropic acató la orden legal, pero no sin antes marcar su posición. La empresa consideró que aplicar este estándar de forma consistente en toda la industria significaría frenar prácticamente todos los lanzamientos de modelos de frontera, y advirtió que el proceso utilizado por el gobierno no fue transparente, claro ni técnicamente fundado.
«Creemos que el gobierno debe tener la capacidad de bloquear despliegues inseguros, pero como parte de un proceso estatutario que sea transparente, justo, claro y basado en hechos técnicos. Esta acción no se ajusta a esos principios», sostuvo la compañía en su declaración oficial.
La firma precisó que el acceso al resto de sus modelos no se ve afectado por la medida y que trabaja para restablecer Fable 5 y Mythos 5 lo antes posible, en lo que calificó como un malentendido.
TecnologíaEl modelo de IA «más seguro» del mundo duró 48 horas antes de ser vulnerado
La irrupción de la IA china DeepSeek sacude las bolsas y amenaza el dominio de Nvidia y otras tecnológicas
Inteligencia artificial en casinos online: mejorando la experiencia del usuario
El fin de mirar por encima del hombro con el S26 Ultra: Samsung estrena la primera Pantalla de Privacidad integrada

Deja una respuesta