TTT-E2E: Modelul AI care învață în timp ce citește (Adio KV Cache?)

Cercetătorii de la Stanford, NVIDIA și UC Berkeley au dezvoltat TTT-E2E, un model AI care își evoluează starea internă în timp ce citește, redefinind modelarea contextului lung ca o problemă de învățare continuă. Această abordare inovatoare comprimă contextul în parametri interni, oferind un cost constant de inferență și performanță de atenție completă chiar și la 128K de jetoane.

Rezumat Detaliat

Modelul TTT-E2E, o colaborare între Stanford, NVIDIA și UC Berkeley, abordează costurile computaționale ale arhitecturilor Transformer tradiționale atunci când gestionează contexte lungi. Spre deosebire de Transformatoarele standard care se bazează pe un KV Cache, care crește liniar cu lungimea secvenței, TTT-E2E își actualizează greutățile în timpul citirii, tratând intrarea ca un set de antrenament. Această alegere de proiectare are ca rezultat un cost constant de inferență și menține calitatea mecanismelor tradiționale de atenție. Inovația de bază a modelului constă în comprimarea contextului în parametrii săi interni, înlocuind KV cache-ul voluminos cu o stare ascunsă actualizată printr-un obiectiv de învățare auto-supervizată în timpul parcurgerii înainte. Această abordare permite procesarea eficientă a documentelor masive sau a bazelor de cod în timp real. Trecerea de la procesarea bazată pe memorie la învățarea din mers deschide noi posibilități pentru edge computing și analiza de conținut pe termen lung. TTT-E2E face legătura între eficiența RNN/SSM și puterea Transformatoarelor, transformând starea ascunsă într-o rețea neuronală dinamică. Deși există limitări în comparație cu modelele de atenție completă în sarcini specifice de raționament, schimbarea arhitecturală către modele care se adaptează datelor în timp real este semnificativă. Lucrarea oficială și codul sursă sunt disponibile pentru o explorare suplimentară.

⚠️ Notă: Acesta este un rezumat generat automat. Drepturile asupra conținutului aparțin sursei originale. Citește articolul complet aici

Sursa originală

Citește articolul complet aici

Deschide Original

Articole similare

AI & ML•23 mai

Anthropic va strânge încă 30 de miliarde de dolari pentru o evaluare de 900 de miliarde de dolari: Raport

Potrivit informațiilor, Anthropic se pregătește să asigure o nouă rundă de finanțare, care ar putea depăși 30 de miliarde de dolari. Aceasta ar crește semnificativ evaluarea companiei.

AI & ML•23 mai

Imaginile ChatGPT conțin markere AI invizibile pe care oricine le poate detecta: Ce trebuie să știe utilizatorii care nu pot dezvălui AI generativ

Imaginile generate de ChatGPT și API-ul OpenAI din 19 mai 2026 conțin markere invizibile care le identifică ca fiind produse de AI. Aceste markere persistă prin diverse manipulări, cum ar fi capturi de ecran și modificări de format. O unealtă publică gratuită este disponibilă pentru verificare.

AI & ML•23 mai

Decizia Curții Supreme ar putea expune conversațiile AI și căutările de cuvinte cheie poliției

Curtea Supremă este pe cale să decidă într-un caz privind mandatele de geofence, ceea ce ar putea afecta în mod semnificativ confidențialitatea digitală. Această hotărâre, Chatrie v. United States, are implicații asupra modului în care autoritățile accesează datele de localizare și, potențial, alte informații digitale.

AI & ML•23 mai

Google a acceptat 6.000 de contribuții Gemini CLI, apoi a închis instrumentul doar pentru Enterprise

Google a acceptat contribuții de cod pentru un instrument terminal AI open-source timp de aproape un an. Pe 19 mai 2026, au anunțat retragerea accesului API pentru utilizatorii care nu plătesc, mutând viitorul proiectului către clienții enterprise. Un succesor closed-source a înlocuit originalul, lipsindu-i unele caracteristici.