Investigadores de Anthropic encuentran el uso oculto de los LLMs

CategoríaInstitution

Anthropic researchers find the hidden usage of large language models is tracked as a internet infrastructure institution within the internet infrastructure ecosystem.

RegiónGlobal

Anthropic researchers find the hidden usage of large language models has public-source relevance to network operations, governance, dependency mapping, or market structure.

Señal principalMarket

Anthropic researchers find the hidden usage of large language models has public-source relevance to network operations, governance, dependency mapping, or market structure.

Tipo de contenidoPROFILE

Anthropic researchers find the hidden usage of large language models is tracked as a internet infrastructure institution within the internet infrastructure ecosystem.

Dominio principalSecurity

Public-source signals support medium-impact monitoring for infrastructure visibility and dependency analysis.

TemaMarket

ImpactoMedium

Public-source signals support medium-impact monitoring for infrastructure visibility and dependency analysis.

Confianza?Confianza limitada (72%)

Varias fuentes públicas

Investigadores de Anthropic descubrieron una nueva vulnerabilidad en los grandes modelos de lenguaje (LLMs) llamada “many-shot jailbreaking”, donde preparar al modelo con múltiples preguntas inofensivas puede eventualmente llevarlo a proporcionar respuestas inapropiadas, como instrucciones para construir una bomba.
La vulnerabilidad se atribuye al aumento de la “ventana de contexto” de los últimos LLMs, lo que les permite retener grandes cantidades de datos en la memoria a corto plazo.
Para abordar este problema, los investigadores están trabajando en clasificar y contextualizar las consultas antes de introducirlas en el modelo, con el objetivo de mitigar el riesgo mientras se mantienen los niveles de rendimiento.

Una nueva vulnerabilidad en los grandes modelos de lenguaje: el ‘many-shot jailbreaking’ permite respuestas inapropiadas al preparar con preguntas inofensivas. Ver también: Ziggo Group nombra a sus líderes antes de su salida a bolsa en Ámsterdam en 2027.

Investigadores de Anthropic encuentran un error en los LLMs

¿Cómo consigues que una IA responda a una pregunta que no debería? Existen muchas técnicas de “jailbreak”, y los investigadores de Anthropic acaban de encontrar una nueva, en la que se puede convencer a los grandes modelos de lenguaje (LLMs) para que te digan cómo construir una bomba si primero los preparas con unas cuantas docenas de preguntas menos dañinas. Ver también: Asociación ECHOES.

Esta investigación ha sido documentada en un artículo y compartida con la comunidad de IA, revelando que los LLMs con ventanas de contexto más grandes tienden a tener un mejor rendimiento en varias tareas cuando se les proporcionan numerosos ejemplos dentro del prompt. Esto incluye preguntas triviales, donde la exposición repetida mejora la precisión de las respuestas con el tiempo. Sin embargo, este mismo mecanismo se extiende a responder consultas inapropiadas, lo que hace más probable que el modelo cumpla después de ser preparado con una serie de preguntas inofensivas. Ver también: IT Department - Athlok.

Lea también: ¿Abuso de IA? Disney evade críticas por el póster de “Loki”

Crece la preocupación por el abuso de la IA

El error podría causar grandes olas en el ámbito tecnológico, despertando la preocupación de la gente sobre el abuso de la IA. Aunque el mecanismo exacto detrás de este comportamiento sigue sin estar claro, los investigadores especulan que implica la capacidad del modelo para discernir la intención del usuario basándose en el contexto proporcionado. Ver también: Alejandro Estua.

El equipo ya informó a sus colegas e incluso a sus competidores sobre este ataque, algo que esperan que “fomente una cultura donde exploits como este se compartan abiertamente entre proveedores e investigadores de LLMs”. Sin embargo, mitigar esta vulnerabilidad plantea desafíos, ya que limitar la ventana de contexto afecta negativamente el rendimiento del modelo. Ver también: Alejandro Manzo.

Dominio de operación

Anthropic researchers find the hidden usage of large language models se lee a partir de su rol público, contexto operativo y cobertura relacionada.

Rol público: Anthropic researchers find the hidden usage of large language models se sigue por su rol visible, contexto de servicio y material verificable. Base de evidencia: Anthropic researchers find the hidden usage of large language models article record; Anthropic researchers find the hidden usage of large language models article record
Superficie operativa: Market y Global dan el contexto público de este perfil de institución. Base de evidencia: Anthropic researchers find the hidden usage of large language models article record; Anthropic researchers find the hidden usage of large language models article record

Cronología

08 jun 2026
Perfil público de Anthropic researchers find the hidden usage of large language models actualizado
La cobertura pública registra a Anthropic researchers find the hidden usage of large language models como sujeto para revisar rol, contexto operativo y evidencia.

De un vistazo

Nombre: Anthropic researchers find the hidden usage of large language models
Tipo: Internet infrastructure institution
Base: Global
Enfoque del perfil: Institution

Qué hace

Los registros públicos permiten seguir su rol, servicios y relaciones clave.

Por qué importa

Public-source signals support medium-impact monitoring for infrastructure visibility and dependency analysis.
Criticidad operativa: Medium
Horizonte: Next quarter

Qué vigilar

El seguimiento se centra en continuidad de servicio verificada, cambios de gobernanza y señales relacionales.

AhoraMedium prioridad

Seguir actualizaciones de fuentes verificadas, cambios de rol y evidencia pública actual.

TrimestreMedium sensibilidad política

Public-source signals support medium-impact monitoring for infrastructure visibility and dependency analysis.

AñoNext quarter perspectiva

La relevancia a largo plazo depende de cambios operativos, políticos y relacionales verificados.

Briefing para miembros

Contexto de perfil profundo

Inicia sesión para desbloquear el briefing de perfil completo y las notas de fuente.

Solo para Círculo Estratégico

Círculo Estratégico

Abierto a todos los lectores. Desbloquea briefings de perfil después de unirte e iniciar sesión.

Unirse al Círculo Estratégico

Solo para Alianza de Liderazgo

Alianza de Liderazgo

Para propietarios y directivos cualificados de activos IP; inicia sesión para desbloquear briefings de alianza.

Unirse a la Alianza de Liderazgo

Vista pública

La lectura pública de Anthropic researchers find the hidden usage of large language models se limita al rol visible, contexto operativo y relaciones respaldadas por evidencia.

Puntos de vigilancia

Nuevos roles, asociaciones, productos, políticas o señales de mercado públicas.
Cambios relacionales verificados que involucren organizaciones o personas nombradas.

Salvedades

Las afirmaciones privadas o no verificadas quedan fuera de esta vista pública.

Preguntas frecuentes

¿Por qué se incluye Anthropic researchers find the hidden usage of large language models?

Anthropic researchers find the hidden usage of large language models tiene evidencia pública que lo vuelve relevante para la cobertura de infraestructura digital, gobernanza o mercados.

¿Qué es público en este perfil?

La capa pública cubre rol visible, contexto operativo, entidades vinculadas y puntos de vigilancia respaldados por evidencia.

¿Qué deberían vigilar los lectores?

Los lectores deben seguir cambios de rol con fuentes, nuevas alianzas, exposición regulatoria, expansión operativa o evidencia que cambie la evaluación pública.

← Volver Todas las empresas

0.90–1.00	A	High — direct sources
0.75–0.89	A/B	Strong
0.55–0.74	B/C	Medium
0.35–0.54	C/D	Weak–medium
0.10–0.34	D	Weak signal
0.00–0.09	D	Internal monitoring

Anthropic researchers find the hidden usage of large language models

Fuentes

Investigadores de Anthropic encuentran un error en los LLMs