ما هو التعرف الضوئي على الحروف (OCR)؟

يشير التعرف الضوئي على الحروف (OCR) إلى برنامج يقوم بإنشاء نسخة رقمية من مستند مطبوع أو مكتوب أو مكتوب بخط اليد يمكن لأجهزة الكمبيوتر قراءته دون الحاجة إلى كتابة النص أو إدخاله يدويًا. يُستخدم OCR بشكل عام على المستندات الممسوحة ضوئيًا بتنسيق PDF ، ولكن يمكنه أيضًا إنشاء نسخة نصية يمكن قراءتها بالكمبيوتر داخل ملف صورة.

ما هو OCR؟

تعرف OCR أيضًا باسم التعرف على النص ، وهي تقنية برمجية تقوم بتحويل الأحرف مثل الأرقام والحروف وعلامات الترقيم (تسمى أيضًا الحروف الرسومية) من المستندات المطبوعة أو المكتوبة إلى نموذج إلكتروني يسهل التعرف عليها وقراءتها بواسطة أجهزة الكمبيوتر وبرامج أخرى. بعض برامج التعرف الضوئي على الحروف تقوم بذلك كوثيقة يتم مسحها ضوئيًا أو تصويرها باستخدام كاميرا رقمية ويمكن للآخرين تطبيق هذه العملية على المستندات التي تم مسحها ضوئيًا أو تصويرها مسبقًا دون OCR. يتيح OCR للمستخدمين البحث داخل مستندات PDF ، وتعديل النص ، وإعادة تنسيق المستندات.

ما هو OCR المستخدمة؟

من أجل إجراء مسح سريع للاحتياجات اليومية ، قد لا يكون OCR صفقة كبيرة. إذا قمت بإجراء قدر كبير من المسح الضوئي ، فإن القدرة على البحث داخل ملفات PDF للعثور على ما تحتاج إليه بالضبط يمكن أن يوفر الكثير من الوقت ويجعل وظيفة OCR في برنامج الماسح الضوئي أكثر أهمية. إليك بعض الأشياء الأخرى التي يساعدك OCR في:

معالجة البيانات الآلية وإدخال البيانات (مثال: أنظمة تتبع المتقدمين للوظائف للسير الذاتية)
جعل الكتب الممسوحة ضوئيًا قابلة للبحث
تحويل عمليات المسح المكتوبة بخط اليد إلى نص يمكن قراءته بواسطة الكمبيوتر
جعل المستندات أكثر قابلية للاستخدام بواسطة برامج القراءة التي تساعد المستخدمين المعاقين بصريًا
الحفاظ على الوثائق التاريخية والصحف ، مع جعلها قابلة للبحث أيضًا
استخراج البيانات ونقلها إلى برامج المحاسبة (مثال: الإيصالات والفواتير)
وثائق الفهرسة للاستخدام من قبل محركات البحث
التعرف على لوحات رخصة القيادة بواسطة كاميرا السرعة وبرنامج الكاميرا ذات الضوء الأحمر
إن آلات النطق المخاطبة للأشخاص الذين لا يستطيعون الكلام - الفيزيائي النظري ، ستيفن هوكينج ، ربما يكون المستخدم الأكثر شهرة لبرنامج المزج الكلام.

لماذا استخدام OCR؟

لماذا لا تأخذ صورة فقط ، أليس كذلك؟ لأنك لن تكون قادرًا على تحرير أي شيء أو البحث في النص لأنه سيكون مجرد صورة. يمكن أن يؤدي مسح المستند وتشغيل برنامج OCR إلى تحويل هذا الملف إلى شيء يمكنك تحريره وتكون قادرًا على البحث.

تاريخ OCR

على الرغم من أن الاستخدام المبكر لتواريخ التعرف على النصوص يرجع إلى عام 1914 ، إلا أن التطور الواسع في استخدام التكنولوجيا المرتبطة بالتعرف الضوئي على الحروف بدأ بشكل جدي في الخمسينات من القرن العشرين ، خاصة مع إنشاء خطوط مبسطة جدًا يسهل تحويلها إلى نص يمكن قراءته رقميًا. تم إنشاء أول هذه الخطوط المبسطة بواسطة David Shepard والمعروف باسم OCR-7B. لا يزال OCR-7B مستخدمًا اليوم في المجال المالي للخط القياسي المستخدم في بطاقات الائتمان وبطاقات الخصم. في الستينات ، بدأت الخدمات البريدية في العديد من البلدان باستخدام تقنية التعرف الضوئي على الحروف لتسريع عملية فرز البريد ، بما في ذلك الولايات المتحدة وبريطانيا العظمى وكندا وألمانيا. لا يزال OCR هو التقنية الأساسية المستخدمة في تصنيف البريد لخدمات البريد في جميع أنحاء العالم. في عام 2000 ، تم استخدام المعرفة الأساسية لحدود وقدرات تكنولوجيا التعرف الضوئي على الحروف لتطوير برامج اختبار CAPTCHA المستخدمة في إيقاف برامج التتبع والمرسلين غير المرغوب فيهم.

على مر العقود ، نمت OCR أكثر دقة وأكثر تطورا بسبب التقدم في مجالات التكنولوجيا ذات الصلة مثل الذكاء الاصطناعي ، والتعلم الآلي ، ورؤية الكمبيوتر. واليوم ، يستخدم برنامج OCR التعرف على الأنماط ، وكشف الميزات ، وتعدين النصوص لتحويل المستندات بشكل أسرع وأكثر دقة من أي وقت مضى.