
Noul cadru AI al Nvidia antrenează un model de 8B pentru a gestiona instrumente ca un profesionist
Nvidia și Universitatea din Hong Kong au lansat Orchestrator, un model cu 8 miliarde de parametri care coordonează instrumente și LLM-uri. Orchestrator a obținut o precizie mai mare la un cost mai mic decât modelele mai mari în testele de utilizare a instrumentelor.
Reclamă
728 × 90
Rezumat Detaliat
Cercetătorii de la Nvidia și Universitatea din Hong Kong au dezvoltat Orchestrator, un model cu 8 miliarde de parametri conceput pentru a coordona diverse instrumente și LLM-uri pentru rezolvarea problemelor complexe. Acest model a demonstrat o precizie superioară și o eficiență a costurilor în comparație cu modelele mai mari în testele de utilizare a instrumentelor, aliniindu-se, de asemenea, preferințelor utilizatorilor. Antrenamentul Orchestrator a fost facilitat de ToolOrchestra, un nou cadru de învățare prin întăriri, care se concentrează pe antrenarea modelelor mai mici pentru a acționa ca coordonatori inteligenți. Această abordare sugerează că un sistem compozit, în care un orchestrator mai mic gestionează o echipă de modele și instrumente specializate, poate fi mai eficient decât un singur sistem AI mare.
⚠️ Notă: Acesta este un rezumat generat automat. Drepturile asupra conținutului aparțin sursei originale. Citește articolul complet aici
Sursa originală
Citește articolul complet aici
Reclamă
728 × 90
Articole similare

Modelele open-source chinezești reprezintă 30% din utilizarea globală a AI: raport
Un raport indică faptul că modelele AI open-source chinezești sunt utilizate în 30% din aplicațiile globale de AI. Articolul subliniază influența tot mai mare a modelelor AI chinezești.

Vulnerabilități critice găsite în GitHub Copilot, Gemini CLI, Claude și alte instrumente AI afectează milioane
GBHackers News a raportat vulnerabilități critice în mai multe instrumente AI. Aceste vulnerabilități afectează milioane de utilizatori.

GeoVista aduce geolocația AI open-source aproape de paritate cu modelele comerciale de top
GeoVista, un model de geolocație AI open-source, a atins aproape paritatea cu modelele comerciale de top. Această realizare oferă o alternativă viabilă și rentabilă pentru sarcinile de geolocație.

AWS abordează problema 'Prea multă informație' a AI
AWS abordează provocarea de a oferi cunoștințe specializate agenților AI fără a-i copleși cu context. Noul sistem de puteri al Kiro este cheia.