
AgentEvolver de la Alibaba îmbunătățește performanța modelului în utilizarea instrumentelor cu ~30% folosind sarcini sintetice, generate automat
Laboratorul Tongyi al Alibaba a dezvoltat AgentEvolver, un cadru pentru agenți auto-evoluativi care generează propriile date de antrenament. AgentEvolver folosește LLM-uri pentru învățare autonomă, reducând costul colectării seturilor de date specifice sarcinilor.
Reclamă
728 × 90
Rezumat Detaliat
AgentEvolver, un nou cadru de la Tongyi Lab al Alibaba, permite agenților auto-evoluativi să creeze propriile date de antrenament prin explorarea mediilor lor de aplicație. Acest cadru valorifică cunoștințele și capacitățile de raționament ale modelelor lingvistice mari pentru învățare autonomă. Experimentele arată că AgentEvolver este mai eficient în explorarea mediului său, folosește mai bine datele și se adaptează mai rapid decât cadrele tradiționale de învățare prin întărire.
Costul ridicat și efortul manual de colectare a seturilor de date specifice sarcinilor sunt abordate de AgentEvolver. Învățarea prin întărire necesită adesea o muncă manuală semnificativă pentru a crea exemple de sarcini, în special în medii software noi sau proprietare. Bucla de auto-antrenament a cadrului permite agentului să se îmbunătățească continuu prin interacțiunea cu mediul său țintă, fără sarcini predefinite sau funcții de recompensă.
AgentEvolver folosește auto-întrebarea pentru a explora mediul său, a genera sarcini diverse și a rafina performanța. Acest lucru reduce nevoia de seturi de date realizate manual, permițând agentului și sarcinilor sale să co-evolueze și să gestioneze provocări mai complexe. Sistemul este conceput pentru a obține o evoluție autonomă și eficientă a capacităților prin interacțiunea cu mediul.
⚠️ Notă: Acesta este un rezumat generat automat. Drepturile asupra conținutului aparțin sursei originale. Citește articolul complet aici
Sursa originală
Citește articolul complet aici
Reclamă
728 × 90
Articole similare

Modelele open-source chinezești reprezintă 30% din utilizarea globală a AI: raport
Un raport indică faptul că modelele AI open-source chinezești sunt utilizate în 30% din aplicațiile globale de AI. Articolul subliniază influența tot mai mare a modelelor AI chinezești.

Vulnerabilități critice găsite în GitHub Copilot, Gemini CLI, Claude și alte instrumente AI afectează milioane
GBHackers News a raportat vulnerabilități critice în mai multe instrumente AI. Aceste vulnerabilități afectează milioane de utilizatori.

GeoVista aduce geolocația AI open-source aproape de paritate cu modelele comerciale de top
GeoVista, un model de geolocație AI open-source, a atins aproape paritatea cu modelele comerciale de top. Această realizare oferă o alternativă viabilă și rentabilă pentru sarcinile de geolocație.

AWS abordează problema 'Prea multă informație' a AI
AWS abordează provocarea de a oferi cunoștințe specializate agenților AI fără a-i copleși cu context. Noul sistem de puteri al Kiro este cheia.