
Injectarea de prompturi prin poezie
Cercetătorii au descoperit că transformarea prompturilor în poezie poate sparge securitatea Large Language Models (LLM). Au constatat că prompturile poetice au avut rate mari de succes în atacuri pe diverse modele și domenii de siguranță.
Reclamă
728 × 90
Rezumat Detaliat
O nouă lucrare, "Poezia adversă ca mecanism universal de jailbreak cu o singură tură în modelele lingvistice mari", dezvăluie că prompturile poetice pot ocoli mecanismele de siguranță în LLM. Studiul a testat 25 de modele, unele depășind ratele de succes ale atacurilor de 90%. Cercetarea a folosit un model ML pentru a traduce prompturi dăunătoare din proză în versuri. Lucrarea nu oferă exemple de prompturi poetice, invocând preocupări de securitate. Studiul a folosit un set mic de poezii adversare realizate manual în engleză și italiană pentru a testa dacă structura poetică singură poate modifica comportamentul de refuz în LLM.
⚠️ Notă: Acesta este un rezumat generat automat. Drepturile asupra conținutului aparțin sursei originale. Citește articolul complet aici
Sursa originală
Citește articolul complet aici
Reclamă
728 × 90
Articole similare

Modelele open-source chinezești reprezintă 30% din utilizarea globală a AI: raport
Un raport indică faptul că modelele AI open-source chinezești sunt utilizate în 30% din aplicațiile globale de AI. Articolul subliniază influența tot mai mare a modelelor AI chinezești.

Vulnerabilități critice găsite în GitHub Copilot, Gemini CLI, Claude și alte instrumente AI afectează milioane
GBHackers News a raportat vulnerabilități critice în mai multe instrumente AI. Aceste vulnerabilități afectează milioane de utilizatori.

GeoVista aduce geolocația AI open-source aproape de paritate cu modelele comerciale de top
GeoVista, un model de geolocație AI open-source, a atins aproape paritatea cu modelele comerciale de top. Această realizare oferă o alternativă viabilă și rentabilă pentru sarcinile de geolocație.

AWS abordează problema 'Prea multă informație' a AI
AWS abordează provocarea de a oferi cunoștințe specializate agenților AI fără a-i copleși cu context. Noul sistem de puteri al Kiro este cheia.