الأحد، 17 مايو 2009

تقنية OCR


كما نعلم أن العديد من المؤسسات العلمية والثقافية خصوصا دور البحوث والدراسات تقوم بالعديد من عمليات الأرشفة اليومية بشكل يدوي أم باستخدام الحاسوب الآلي، وقد بدأت منذ فترة ليست ببعيدة بانتهاج أسلوب القراءة الآلية للنصوص حتى تقوم بمساندتهم في مجال الأرشفة، ولا يمكن القول أنها تعتمد كليا عليها وذلك بسبب بعض الصعوبات التي ما زالت تواجه تلك التقنية خصوصا عند استخدامها للقراءة الآلية للنصوص العربية في وقتنا الحاضر، فكيف تعمل تلك التقنية وما فوائدها وسلبياتها؟
تعرف ال OCR بتقنية التعرف الضوئي أو التعرف الآلي على الحروف بشكل عام مع إمكانية دعمها للعديد من اللغات المعروفة وهي اختصار ل Optical Character Recognition
وتختص برمجيات التعرف الضوئي على الحروف بالقيام بمجموعة من العمليات والخطوات التي تستهدف التعرف وقراءة نص معين أثناء إجراء عملية المسح الضوئي له، وتقوم بالتعرف على محتويات النص حرف عبر حرف وكلمة عبر كلمة ومن ثم تحويله إلى ملف نصي يتضمن على بيانات ومعلومات مكودة في شكل معيار(American Standard Code for Information Interchange) ASCII أو معيار Unicode والذي يحتل غالباً مساحة أقل من تلك التي يحتاج إليها ملف الصور.

Optical Character Recognition المفروض أن يكون التعرف علي الحروف باستخدام أداة ضوئية Optical Instrument كالعدسات والمرايا , وهذا يختلف عن ال Digital Character Recognition أي التعرف علي الحروف رقميا .. لكن كلاهما يحملان نفس المعني الآن ..[1]
[1] مجلة الفريق العربي 2000 http://www.arabteam2000-forum.com/index.php?showtopic=89769 "27-3-1430 هـ"

ليست هناك تعليقات:

إرسال تعليق