Optiskā rakstzīmju atpazīšana 200 valodām
Kursors.lv
Optical Character Recognition (OCR) jeb optiskā rakstzīmju atpazīšana ir iespēja skenētu vai nofotografētu tekstu pārvērst atpakaļ rediģējamā teksta dokumentā. Daudzi pat šo iespēju ir ne vienu reizi vien izmantojuši, nezinot visas rakstzīmju atpazīšanas nianses un iespējas.
Google ar optisko rakstzīmju atpazīšanu ir darbojusies gadiem — digitalizētas grāmatas un dažādi attēli. Šobrīd Google Drive spēj izvilināt no PDF vai JPG dokumenta ar skenētu tekstu jau gatavu, rediģējamu Google Docs datni. Tikko izlaists arī optisko rakstzīmju atpazīšanas Google Drive rīks, kas atpazīst 200 pasaules valodas. To skaitā ir arī latviešu valoda.
Diemžēl šī programma ļauj konvertēt bez maksas vienā reizē tikai 12 PDF lapas. Var nopirkt par pieciem dolāriem atļauju konvertēt 50 lapas vienā reizē. Ir iespējas nopirkt atļaujas dažādam lappušu skaitam līdz pat 50’000 lapām (200 dolāri).
Jau iepriekš izlaista Google Handwriting Input lietotne, kas kalpo kā alternatīva teksta ievadei, bakstot pa burtiem ekrānā. Rokraksta atpazīšana arī daļēji uzskatāma par optisko rakstzīmju atpazīšanas paveidu. Google rokraksta ievade šobrīd spēj atpazīt 82 valodas, un to skaitā ir arī latviešu valoda. Tāpat rokraksta ievadei nepaliek nepamanīti populārāko smaiduļu jeb emoju ikonu atveide ar roku rakstītajā saturā.