Arhivarii folosesc LLM-uri pentru a descifra scrisul de mână la scară largă

Arhivarii folosesc Modele Lingvistice Mari (LLM-uri) pentru a transcrie documente scrise de mână, îmbunătățind semnificativ acuratețea, viteza și costul în comparație cu metodele tradiționale. Acest lucru permite un acces mai ușor la înregistrările istorice, făcând colecțiile anterior ascunse ușor de căutat și deschizând noi posibilități de cercetare.

Rezumat Detaliat

Articolul discută despre aplicarea Modelelor Lingvistice Mari (LLM-uri) în arhive pentru a transcrie documente scrise de mână, o sarcină care a provocat de mult timp cercetătorii în domeniul AI. Metodele tradiționale, cum ar fi software-ul specializat și transcrierea manuală, consumau mult timp și erau costisitoare. Utilizarea LLM-urilor, cum ar fi GPT-4, a demonstrat îmbunătățiri remarcabile în acuratețe, viteză și rentabilitate, depășind software-ul specializat de recunoaștere a scrisului de mână în teste. Această schimbare permite arhivele să-și facă colecțiile ușor de căutat și accesibile, deschizând noi căi pentru cercetarea istorică și explorarea istoriei familiei.

Mark Humphries, profesor de istorie, și colegii săi au testat LLM-urile pe documente istorice, constatând că LLM-urile au atins rate de eroare de caracter sub 2%, semnificativ mai rapid și mai ieftin decât software-ul specializat. Succesul este atribuit cantității vaste de date pe care sunt antrenate LLM-urile, permițându-le să învețe implicit relația dintre textul scris de mână și transcrierile sale. Acest lucru are implicații practice pentru cercetători precum Lianne Leddy, care studiază experiențele femeilor indigene, deoarece reduce drastic timpul și efortul necesar pentru a analiza înregistrările istorice.

Impactul LLM-urilor se resimte deja în instituții precum Universitatea din Carolina de Nord la Chapel Hill, unde bibliotecarii experimentează cu transcrierea AI. Integrarea LLM-urilor în platformele existente, cum ar fi Transkribus, indică o tendință mai largă. Acest progres promite să revoluționeze modul în care funcționează arhivele, făcând informațiile istorice mai accesibile și facilitând o perspectivă mai profundă asupra trecutului. Capacitatea de a transcrie rapid și precis documente scrise de mână are potențialul de a transforma cercetarea istorică și de a debloca informații valoroase din surse anterior inaccesibile.

⚠️ Notă: Acesta este un rezumat generat automat. Drepturile asupra conținutului aparțin sursei originale. Citește articolul complet aici

Sursa originală

Citește articolul complet aici

Deschide Original

Articole similare

AI & ML•2 aug.

Noua Familie de Modele GPT-5.6 de la OpenAI Îmbunătățește Eficiența și Performanța

OpenAI a lansat noua sa familie de modele GPT-5.6, aducând îmbunătățiri semnificative în capacitățile de raționament și eficiența costurilor. Varianta Luna oferă o reducere de 80% a costurilor, în timp ce varianta Sol atinge performanțe de vârf în benchmark-uri.

AI & ML•2 aug.

Moonshot AI lansează Kimi K3: Primul model AI deschis cu 2.8T parametri

Moonshot AI a lansat Kimi K3, primul model AI cu ponderi deschise și 2.8 trilioane de parametri. Acest nou model este conceput special pentru sarcini avansate de codare și raționament, având ca scop competiția cu modelele proprietare de top.

AI & ML•2 aug.

Sistemul „Karpathy” Promite Îmbunătățirea Fluxurilor de Lucru AI de 701 Ori, Câștigând 86.000 de Stele pe GitHub

Un sistem dezvoltat de Andrej Karpathy, denumit „Sistemul Karpathy”, a câștigat rapid popularitate, ajungând la 86.000 de stele pe GitHub. Acest sistem este conceput pentru a îmbunătăți semnificativ fluxurile de lucru AI, oferind un potențial de îmbunătățire de 701 ori.

AI & ML•2 aug.

Jensen Huang Susține Modele AI Open-Source; BofA Afirmă că Producătorii de Cipuri Sunt Plătiți Oricum

CEO-ul NVIDIA, Jensen Huang, și-a exprimat dorința pentru modele AI open-source, considerând că această abordare stimulează inovația și competiția. Analiștii de la Bank of America sugerează că, indiferent de deschiderea modelului, producătorii de cipuri precum NVIDIA vor continua să profite de cererea în creștere pentru hardware AI.