Claude Fable 5, il jailbreak rivendicato e l’architettura a classificatori
Claude Fable 5: a pochi giorni dal lancio un red-teamer rivendica un jailbreak, Anthropic lo nega e poco dopo il governo USA ne impone la sospensione con un export control. Al di là del clamore, contano due cose: l’architettura a classificatori su un unico modello e il precedente di uno Stato che ritira un modello commerciale.

