Çfarë është Njohja Optike e Karaktereve (OCR)?

Përmbajtje:

Çfarë është Njohja Optike e Karaktereve (OCR)?
Çfarë është Njohja Optike e Karaktereve (OCR)?
Anonim

Njohja optike e karaktereve (OCR) i referohet softuerit që krijon një version dixhital të një dokumenti të printuar, të shtypur ose të shkruar me dorë, të cilin kompjuterët mund ta lexojnë pa pasur nevojë të shtypni manualisht ose të futni tekstin. OCR zakonisht përdoret në dokumentet e skanuara në format PDF, por gjithashtu mund të krijojë një version të tekstit të lexueshëm nga kompjuteri brenda një skedari imazhi.

Çfarë është OCR

OCR, i referuar gjithashtu si njohja e tekstit, është teknologji softuerike që transformon karaktere të tilla si numrat, shkronjat dhe shenjat e pikësimit (të quajtura edhe glifet) nga dokumentet e shtypura ose të shkruara në një formë elektronike që njihet dhe lexohet më lehtë nga kompjuterët dhe programe të tjera softuerike. Disa programe OCR e bëjnë këtë pasi një dokument skanohet ose fotografohet me një aparat fotografik dixhital dhe të tjerët mund ta zbatojnë këtë proces për dokumentet që janë skanuar ose fotografuar më parë pa OCR. OCR i lejon përdoruesit të kërkojnë brenda dokumenteve PDF, të modifikojnë tekstin dhe të riformatojnë dokumentet.

Image
Image
Skanimi i gazetës historike me softuerin OCR.

Getty Images

Për çfarë përdoret OCR?

Për nevojat e skanimit të shpejtë dhe të përditshëm, OCR mund të mos jetë një punë e madhe. Nëse bëni një sasi të madhe skanimi, aftësia për të kërkuar brenda skedarëve PDF për të gjetur atë që ju nevojitet, mund të kursejë mjaft kohë dhe e bën funksionalitetin OCR në programin tuaj të skanerit më të rëndësishëm. Këtu janë disa gjëra të tjera me të cilat OCR ndihmon:

  • Përpunimi i automatizuar i të dhënave dhe futja e të dhënave (Shembull: Sistemet e gjurmimit të aplikantëve për punë për rezyme).
  • Bëni librat e skanuar të kërkueshëm.
  • Konvertimi i skanimeve të shkruara me dorë në tekst të lexueshëm nga kompjuteri.
  • Duke bërë dokumente më të përdorshme nga programet e lexuesve që ndihmojnë përdoruesit me shikim të dëmtuar.
  • Ruajtja e dokumenteve historike dhe gazetave, duke i bërë ato të kërkueshme.
  • Nxjerrja dhe transferimi i të dhënave në programet e kontabilitetit (Shembull: Faturat dhe faturat).
  • Indeksimi i dokumenteve për përdorim nga motorët e kërkimit.
  • Njohja e targave të shoferit nga një kamerë shpejtësie dhe softuer me dritë të kuqe.
  • Sintetizues të të folurit për njerëzit që nuk mund të flasin – fizikani teorik, Stephen Hawking, është ndoshta përdoruesi më i njohur i një programi sintetizues të të folurit.

Përfundim

Pse të mos bëni thjesht një foto, apo jo? Sepse nuk do të mund të redaktoni asgjë ose të kërkoni tekstin sepse do të ishte thjesht një imazh. Skanimi i dokumentit dhe ekzekutimi i softuerit OCR mund ta kthejë atë skedar në diçka që mund ta modifikoni dhe të jeni në gjendje ta kërkoni.

Historia e OCR

Ndërsa përdorimi më i hershëm i njohjes së tekstit daton në vitin 1914, zhvillimi dhe përdorimi i gjerë i teknologjive të lidhura me OCR filloi seriozisht në vitet 1950, veçanërisht me krijimin e shkronjave shumë të thjeshtuara që ishin më të lehta për t'u konvertuar në dixhital- tekst i lexueshëm. I pari nga këto fontet e thjeshtuara u krijua nga David Shepard dhe i njohur zakonisht si OCR-7B. OCR-7B është ende në përdorim sot në industrinë financiare për fontin standard të përdorur në kartat e kreditit dhe kartat e debitit. Në vitet 1960, shërbimet postare në disa vende filluan të përdorin teknologjinë OCR për të shpejtuar shumë renditjen e postës, duke përfshirë Shtetet e Bashkuara, Britaninë e Madhe, Kanadanë dhe Gjermaninë. OCR është ende teknologjia kryesore që përdoret për të renditur postën për shërbimet postare në mbarë botën. Në vitin 2000, njohuritë kryesore të kufijve dhe aftësive të teknologjisë OCR u përdorën për të zhvilluar programet CAPTCHA të përdorura për të ndaluar bots dhe spammers.

Gjatë dekadave, OCR është bërë më i saktë dhe më i sofistikuar për shkak të përparimeve në fushat e teknologjisë përkatëse si inteligjenca artificiale, mësimi i makinerive dhe vizioni kompjuterik. Sot, softueri OCR përdor njohjen e modelit, zbulimin e veçorive dhe nxjerrjen e tekstit për të transformuar dokumentet më shpejt dhe më saktë se kurrë më parë.

FAQ

    Si t'i skanoj dokumentet me telefonin ose tabletin tim?

    Në iOS, hapni aplikacionin Notes dhe krijoni një shënim të ri. Hapni kamerën dhe më pas prekni Scan Documents. Në Android, hapni Google Drive dhe zgjidhni Plus (+), më pas prekni Scan për të skanuar dokument me telefonin tuaj.

    Si mund ta përdor OCR në Adobe Acrobat?

    Hap një skedar PDF që përmban një imazh të skanuar, më pas zgjidh Tools > Modifiko PDF. Acrobat do të aplikojë automatikisht OCR në mënyrë që të mund të redaktoni tekstin. Thjesht zgjidhni vendin ku dëshironi të bëni modifikime dhe filloni të shkruani.

    Cili është ndryshimi midis OCR dhe OMR?

    Njohja e shenjave optike (OMR) është softuer që zbulon shenjat në letër, zakonisht një fletë flluskë. OMR përdoret për të përpunuar rezultatet e provimeve, anketave, pyetësorëve dhe madje edhe zgjedhjeve. Ndryshe nga OCR, OMR nuk mund të deshifrojë shenjat në faqe, por vetëm verifikon që shenjat janë aty.

Recommended: