
Noua metodă de antrenament îmbunătățește raționamentul multimodal AI cu seturi de date mai mici și mai inteligente
Cercetătorii au dezvoltat OpenMMReasoner, un nou cadru de antrenament pentru a îmbunătăți capacitățile de raționament multimodal ale modelelor lingvistice. Acesta utilizează un proces în două etape, care implică reglarea fină supravegheată și învățare prin întărire, conducând la o performanță îmbunătățită cu seturi de date mai mici și de înaltă calitate.
Reclamă
728 × 90
Rezumat Detaliat
MiroMind AI și mai multe universități chineze au lansat OpenMMReasoner, un nou cadru de antrenament pentru a îmbunătăți modelele lingvistice în raționamentul multimodal. Cadrul folosește un proces în două etape: reglare fină supravegheată și învățare prin întărire. Experimentele arată că modelele antrenate cu OpenMMReasoner depășesc alte modele de raționament vizual, adesea folosind seturi de date mai mici. Cadrul și resursele sale sunt open source, oferind o bază pentru aplicații care necesită trasabilitate și robustețe. OpenMMReasoner oferă beneficii pentru companiile care caută dincolo de sistemele mari, închise, permițând implementarea locală, reducerea latenței, costuri mai mici de token și control complet al datelor.
⚠️ Notă: Acesta este un rezumat generat automat. Drepturile asupra conținutului aparțin sursei originale. Citește articolul complet aici
Sursa originală
Citește articolul complet aici
Reclamă
728 × 90
Articole similare

Modelele open-source chinezești reprezintă 30% din utilizarea globală a AI: raport
Un raport indică faptul că modelele AI open-source chinezești sunt utilizate în 30% din aplicațiile globale de AI. Articolul subliniază influența tot mai mare a modelelor AI chinezești.

Vulnerabilități critice găsite în GitHub Copilot, Gemini CLI, Claude și alte instrumente AI afectează milioane
GBHackers News a raportat vulnerabilități critice în mai multe instrumente AI. Aceste vulnerabilități afectează milioane de utilizatori.

GeoVista aduce geolocația AI open-source aproape de paritate cu modelele comerciale de top
GeoVista, un model de geolocație AI open-source, a atins aproape paritatea cu modelele comerciale de top. Această realizare oferă o alternativă viabilă și rentabilă pentru sarcinile de geolocație.

AWS abordează problema 'Prea multă informație' a AI
AWS abordează provocarea de a oferi cunoștințe specializate agenților AI fără a-i copleși cu context. Noul sistem de puteri al Kiro este cheia.