Majhna skupina nepooblaščenih uporabnikov je pridobila dostop do Anthropicovega modela umetne inteligence Mythos, zmogljivega orodja za kibernetsko varnost, ki ga podjetje zaradi potencialne nevarnosti ni dalo v javno uporabo. Anthropic je potrdil, da preiskuje incident, ki naj bi se zgodil preko okolja enega od njihovih zunanjih pogodbenih partnerjev.
Model, uradno znan kot Claude Mythos Preview, je bil zasnovan za odkrivanje in izkoriščanje ranljivosti v programski opremi. Zaradi teh zmogljivosti je Anthropic njegov dostop omejil na skrbno izbrano skupino partnerjev, vključno s tehnološkimi velikani, kot so Google, Apple in Microsoft, v okviru pobude "Project Glasswing". Namen je bil obrambnim strokovnjakom dati prednost pred morebitnimi napadalci.
Vdor se je zgodil 7. aprila, na isti dan, ko je Anthropic javno oznanil omejeno razpoložljivost modela. Po poročanju medijev je skupina, ki se združuje na zasebnem strežniku Discord, do modela dostopila tako, da je na podlagi poznavanja spletnih naslovov drugih Anthropicovih modelov "izobraženo uganila" pravo lokacijo. Pri tem naj bi sodeloval tudi uslužbenec enega od zunanjih izvajalcev, ki dela za Anthropic.
Anthropic je sporočil, da za zdaj nima dokazov, da bi vdor vplival na njihove osrednje sisteme. Kljub temu incident odpira resna vprašanja o varnostni strategiji Anthropic in o sposobnosti industrije umetne inteligence, da nadzoruje dostop do svojih najzmogljivejših stvaritev. Ta dogodek služi kot jasno opozorilo, da varnostni protokoli, ki temeljijo na zaupanju do partnerjev, morda ne zadoščajo za preprečevanje zlorab.