Բովանդակություն
Օպտիկական նիշերի ճանաչում (OCR) վերաբերում է ծրագրակազմին, որը ստեղծում է տպագիր, մուտքագրվող կամ ձեռագիր փաստաթղթի թվային տարբերակ, որը համակարգիչները կարող են կարդալ առանց տեքստը ձեռքով մուտքագրելու կամ մուտքագրելու անհրաժեշտության: OCR- ն սովորաբար օգտագործվում է սկանավորված փաստաթղթերի վրա PDF ձևաչափով, բայց կարող է նաև ստեղծել տեքստի համակարգչային ընթերցվող տարբերակը պատկերային ֆայլի մեջ:
Ինչ է OCR- ն
OCR- ը, որը նաև կոչվում է տեքստի ճանաչում, այն ծրագրային տեխնոլոգիա է, որը կերպարները, ինչպիսիք են համարները, տառերը և կետադրական կետերը (նաև կոչվում են glyphs), տպագիր կամ գրավոր փաստաթղթերից վերածում են էլեկտրոնային ձևի, որն ավելի հեշտությամբ ճանաչվում և ընթերցվում է համակարգիչների և այլ ծրագրային ծրագրերի միջոցով: Որոշ OCR ծրագրեր դա անում են, քանի որ փաստաթուղթը սկանավորվում կամ լուսանկարվում է թվային ֆոտոխցիկով, իսկ մյուսները կարող են այս գործընթացը կիրառել այն փաստաթղթերի վրա, որոնք նախկինում սկանավորվել են կամ լուսանկարվել առանց OCR: OCR- ն թույլ է տալիս օգտվողներին որոնել PDF փաստաթղթերում, խմբագրել տեքստը և վերաձևակերպել փաստաթղթերը:
Ինչի համար է օգտագործվում OCR- ն:
Արագ, ամենօրյա սկանավորման կարիքների համար OCR- ն կարող է մեծ գործարք չլինել: Եթե դուք մեծ քանակությամբ սկանավորում եք անում, կարողանալով PDF- ներում փնտրել ձեր անհրաժեշտ ճշգրիտը գտնելու համար, կարող է բավականին քիչ ժամանակ խնայել և ձեր սկաների ծրագրում OCR ֆունկցիոնալությունը դարձնել ավելի կարևոր: Ահա մի քանի այլ բաներ, որոնք OCR- ն օգնում է.
- Տվյալների ավտոմատ մշակում և տվյալների մուտքագրում (ՕրինակՌեզյումեների աշխատանքի դիմորդի հետևելու համակարգեր):
- Սկանավորված գրքերը որոնելի դարձնելով:
- Ձեռագիր սկանները համակարգչային ընթերցվող տեքստի վերածելու:
- Ընթերցողի ծրագրերով ավելի օգտագործելի փաստաթղթեր պատրաստելը, որոնք օգնում են տեսողական խնդիրներ ունեցող օգտագործողներին:
- Պատմական փաստաթղթերի և թերթերի պահպանում, միաժամանակ դրանք որոնելի դարձնելով:
- Տվյալների արդյունահանում և հաշվապահական հաշվառման փոխանցման ծրագրեր (օրինակ ՝ ստացումներ և հաշիվ-ապրանքագրեր):
- Որոնման համակարգերի օգտագործման համար փաստաթղթերի ինդեքսավորում:
- Վարորդական պետհամարանիշների ճանաչում արագ ֆոտոխցիկի և կարմիր լույսի ֆոտոխցիկի ծրագրաշարով:
- Խոսքի սինթեզատորներ այն մարդկանց համար, ովքեր չեն կարողանում խոսել. Տեսական ֆիզիկոս Ստեֆան Հոքինգը խոսքի սինթեզատոր ծրագրի թերևս ամենահայտնի օգտվողն է:
Ինչու օգտագործել OCR:
Ինչու՞ ոչ միայն լուսանկարվել, այնպես չէ՞: Քանի որ դուք չեք կարողանա որևէ բան խմբագրել կամ որոնել տեքստը, քանի որ դա պարզապես պատկեր կլիներ: Փաստաթղթի սկանավորումը և OCR ծրագրակազմը գործարկելը կարող է այդ ֆայլը վերածել այն բանի, որը կարող եք խմբագրել և կարողանաք որոնել:
OCR- ի պատմություն
Թեև տեքստի ճանաչման ամենավաղ օգտագործումը թվագրվում է 1914 թվականներին, OCR- ի հետ կապված տեխնոլոգիաների համատարած զարգացումը և օգտագործումը սկսեցին լրջորեն տիրել 1950-ականներին, մասնավորապես ՝ շատ պարզեցված տառատեսակների ստեղծմամբ, որոնք ավելի հեշտ դարձան թվային ընթերցվող տեքստի: Այս պարզեցված տառատեսակներից առաջինը ստեղծվել է Դեյվիդ Շեպարդի կողմից և սովորաբար հայտնի է որպես OCR-7B: OCR-7B- ն այսօր ֆինանսական արդյունաբերության մեջ դեռևս օգտագործվում է վարկային և դեբետային քարտերի համար օգտագործվող ստանդարտ տառատեսակի համար: 1960-ականներին փոստային ծառայությունները մի քանի երկրներում սկսեցին օգտագործել OCR տեխնոլոգիա `փոստերի տեսակավորումը մեծապես արագացնելու համար, ներառյալ Միացյալ Նահանգները, Մեծ Բրիտանիան, Կանադան և Գերմանիան: OCR- ը շարունակում է մնալ այն հիմնական տեխնոլոգիան, որն օգտագործվում է ամբողջ աշխարհում փոստային ծառայությունների փոստի տեսակավորման համար: 2000 թ.-ին OCR տեխնոլոգիայի սահմանների և հնարավորությունների հիմնական գիտելիքներն օգտագործվեցին CAPTCHA ծրագրերը մշակելու համար, որոնք օգտագործվում էին բոտերը և սպամերը դադարեցնելու համար:
Տասնամյակների ընթացքում OCR- ն աճել է ավելի ճշգրիտ և ավելի բարդ `կապված հարակից տեխնոլոգիական ոլորտներում առաջընթացների հետ, ինչպիսիք են արհեստական բանականությունը, մեքենայական ուսուցումը և համակարգչային տեսողությունը: Այսօր OCR ծրագրակազմն օգտագործում է օրինաչափությունների ճանաչում, հնարավորությունների հայտնաբերում և տեքստի արդյունահանում ՝ փաստաթղթերը ավելի արագ և ճշգրիտ փոխակերպելու համար, քան երբևէ: