
Arhivarii folosesc LLM-uri pentru a descifra scrisul de mână la scară largă
Arhivarii folosesc Modele Lingvistice Mari (LLM-uri) pentru a transcrie documente scrise de mână, îmbunătățind semnificativ acuratețea, viteza și costul în comparație cu metodele tradiționale. Acest lucru permite un acces mai ușor la înregistrările istorice, făcând colecțiile anterior ascunse ușor de căutat și deschizând noi posibilități de cercetare.
Rezumat Detaliat
Articolul discută despre aplicarea Modelelor Lingvistice Mari (LLM-uri) în arhive pentru a transcrie documente scrise de mână, o sarcină care a provocat de mult timp cercetătorii în domeniul AI. Metodele tradiționale, cum ar fi software-ul specializat și transcrierea manuală, consumau mult timp și erau costisitoare. Utilizarea LLM-urilor, cum ar fi GPT-4, a demonstrat îmbunătățiri remarcabile în acuratețe, viteză și rentabilitate, depășind software-ul specializat de recunoaștere a scrisului de mână în teste. Această schimbare permite arhivele să-și facă colecțiile ușor de căutat și accesibile, deschizând noi căi pentru cercetarea istorică și explorarea istoriei familiei.
Mark Humphries, profesor de istorie, și colegii săi au testat LLM-urile pe documente istorice, constatând că LLM-urile au atins rate de eroare de caracter sub 2%, semnificativ mai rapid și mai ieftin decât software-ul specializat. Succesul este atribuit cantității vaste de date pe care sunt antrenate LLM-urile, permițându-le să învețe implicit relația dintre textul scris de mână și transcrierile sale. Acest lucru are implicații practice pentru cercetători precum Lianne Leddy, care studiază experiențele femeilor indigene, deoarece reduce drastic timpul și efortul necesar pentru a analiza înregistrările istorice.
Impactul LLM-urilor se resimte deja în instituții precum Universitatea din Carolina de Nord la Chapel Hill, unde bibliotecarii experimentează cu transcrierea AI. Integrarea LLM-urilor în platformele existente, cum ar fi Transkribus, indică o tendință mai largă. Acest progres promite să revoluționeze modul în care funcționează arhivele, făcând informațiile istorice mai accesibile și facilitând o perspectivă mai profundă asupra trecutului. Capacitatea de a transcrie rapid și precis documente scrise de mână are potențialul de a transforma cercetarea istorică și de a debloca informații valoroase din surse anterior inaccesibile.
⚠️ Notă: Acesta este un rezumat generat automat. Drepturile asupra conținutului aparțin sursei originale. Citește articolul complet aici
Sursa originală
Citește articolul complet aici
Articole similare

DXC va integra Claude de la Anthropic în sistemele pentru industrii reglementate
DXC Technology colaborează cu Anthropic pentru a integra asistentul AI Claude în soluțiile sale cloud pentru companii. Această integrare vizează aducerea capabilităților AI avansate în sectoare critice precum sectorul bancar și cel aviatic, îmbunătățind eficiența operațională și serviciile pentru clienți. Colaborarea se concentrează pe oferirea unei implementări AI sigure și fiabile pentru industriile cu cerințe de reglementare stricte.

Anthropic Răspunde Directivei Guvernului SUA de Suspendare a Accesului la Fable 5 și Mythos 5
Anthropic a emis o declarație referitoare la o directivă a guvernului SUA de suspendare a accesului la modelele sale Fable 5 și Mythos 5. Compania cooperează cu directiva, subliniind în același timp angajamentul său față de siguranță și dezvoltarea responsabilă a AI.

Guvernul SUA dispune Anthropic să retragă modelele Fable 5 și Mythos 5
Anthropic a fost obligat de guvernul SUA să dezactiveze noile sale modele AI, Fable 5 și Mythos 5, la doar trei zile după lansare. Această acțiune survine în urma unei dispoziții guvernamentale federale, ale cărei detalii specifice nu sunt prezentate, dar care se referă la reglementările de export.

DiffusionGemma: Noul LLM Open de la Google Atinge 1.000 Tokeni/sec și Schimbă Economia Inferenței
Google DeepMind a lansat DiffusionGemma, un LLM open-weight care utilizează difuzia discretă pentru generarea de text, atingând peste 1.000 de tokeni/sec pe un singur GPU H100. Această nouă arhitectură procesează tokenii în blocuri, oferind îmbunătățiri semnificative de viteză față de modelele autoregresive tradiționale, în detrimentul unei precizii ușor reduse.