Ce este recunoașterea optică a caracterelor (OCR)?

Caracteristica optică de recunoaștere a caracterelor (OCR) se referă la software care creează o versiune digitală a unui document tipărit, tipărit sau scris de mână pe care îl pot citi calculatoarele fără a fi necesar să introduceți sau să introduceți manual textul. OCR este, în general, utilizat pe documente scanate în format PDF , dar poate crea, de asemenea, o versiune text a unui text în cadrul unui fișier imagine.

Ce este OCR?

OCR, numită și recunoașterea textului, este o tehnologie software care transformă caractere, cum ar fi numere, litere și semne de punctuație (numite și glife), din documente tipărite sau scrise într-o formă electronică mai ușor de recunoscută și citită de computere și alte programe software. Unele programe OCR fac acest lucru deoarece un document este scanat sau fotografiat cu o cameră digitală, iar altele pot aplica acest proces documentelor care au fost scanate sau fotografiate anterior fără OCR. OCR permite utilizatorilor să caute în documente PDF, să editeze text și să reformuleze documente.

Ce este OCR folosit pentru?

Pentru nevoi rapide de scanare în fiecare zi, este posibil ca OCR să nu fie o problemă mare. Dacă faceți o mare cantitate de scanare, posibilitatea de a căuta în PDF-uri pentru a găsi exact una de care aveți nevoie poate salva destul timp și face funcționalitatea OCR în programul dvs. de scanare mai importantă. Iată câteva alte lucruri cu care OCR ajută:

De ce să folosiți OCR?

De ce nu luați doar o fotografie, nu? Pentru că nu ați putea să editați nimic sau să căutați textul deoarece ar fi doar o imagine. Scanarea documentului și rularea software-ului OCR pot transforma acel fișier în ceva pe care să îl puteți edita și să îl puteți căuta.

Istoria OCR

În timp ce utilizarea cea mai timpurie a recunoașterii textului datează din 1914, dezvoltarea și utilizarea pe scară largă a tehnologiilor legate de OCR au început serios în anii 1950, în special prin crearea de fonturi foarte simplificate, care au fost mai ușor de convertit în text care poate fi citit digital. Primul dintre aceste fonturi simplificate a fost creat de David Shepard și cunoscut sub numele de OCR-7B. OCR-7B este încă utilizat astăzi în industria financiară pentru fonturile standard folosite pe cardurile de credit și pe cardurile de debit. În anii 1960, serviciile poștale din mai multe țări au început să utilizeze tehnologia OCR pentru a accelera considerabil sortarea prin poștă, inclusiv Statele Unite, Marea Britanie, Canada și Germania. OCR este în continuare tehnologia de bază folosită pentru a sorta poșta pentru serviciile poștale din întreaga lume. În 2000, cunoștințele cheie privind limitele și capacitățile tehnologiei OCR au fost utilizate pentru a dezvolta programele CAPTCHA folosite pentru a opri boturile și spam-urile.

De-a lungul deceniilor, OCR a devenit mai precisă și mai sofisticată datorită progreselor în domeniile tehnologice conexe, cum ar fi inteligența artificială , învățarea mașinilor și viziunea pe calculator. Astăzi, software-ul OCR utilizează recunoașterea modelelor, detectarea funcțiilor și minierele textului pentru a transforma documentele mai rapid și mai precis decât oricând.