الأحد، 17 مايو 2009

معايير اختيار برمجيات OCR

يعتمد اختيار المكتبات ومؤسسات المعلومات لبرمجيات التعرف الضوئي على الحروف في الأساس على مدى صلاحيتها للاستخدام والتطبيق، واشتمالها على قواميس متخصصة غنية وثرية بمفردات المحتوى الموضوعي لنصوص مصادر المعلومات التي يمكن معالجتها بواسطة مثل هذه البرمجيات. وتتضمن معايير الاختيار بالإضافة إلى ذلك مجموعة الإجراءات والآليات المتبعة في التعرف على الحروف والسرعة في قراءتها، وأنواع وأحجام وأشكال الحروف التي يمكن التعرف عليها، واللغات التي تحتويها البرمجيات ويمكن التعامل معها، وأساليب وأنماط عرض وإتاحة النصوص بعد إتمام عملية التعرف عليها، وأن تتضمن تقنيات التعرف الضوئي على بعض المهام المتقدمة منها على سبيل المثال إمكانية التدقيق الإملائي والتوافق مع برمجيات التحرير والنشر وأخيراً يعتبر عامل السعر من العوامل التي يمكن أن تؤخذ في الاعتبار.ويتوافر في ضوء هذه المعايير فئتين من تطبيقات التعرف الضوئي للحروف والتي يتم استخدامها بشكل مستمر في رقمنة مجموعات مصادر معلومات المكتبات الكبرى خاصة الوطنية وهما برنامج "OmniPage Pro" وبرنامج "WordScan". وقد ساعد برنامج"Adobe Capture" على زيادة قيمة هذين البرنامجين وذلك لما له من قدرة عالية على معالجة النصوص ذات التنسيق المعقد، ولعل ذلك يأتي نتيجة استخدام شكل (Portable Document Format) PDF الذي يُمكن من الاحتفاظ بالتنسيق الخاص بالنصوص الأصلية.وإلي جانب مجموعة المعايير السابق ذكرها والخاصة باختيار برمجيات "OCR"، تتوافر سلسلة أخرى من المعايير الهامة والتي يمكن أخذها في الاعتبار ومنها على سبيل المثال:1. الدقة: ويمكن تقدير معدل الدقة من خلال التعرف على نسبة الأخطاء الناجمة عن إجراء القراءة الضوئية للنصوص، ويمكن قياس معدل دقة البرنامج عبر النسبة المئوية للكلمات
2. التطابق والتوافق مع أجهزة المسح الضوئي المتنوعة: من المهم التحقق من نوع أجهزة الماسحات الضوئية التي يمكن أن تتعامل معها برمجيات "OCR"، أي ضرورة التوافق بين جهاز الماسح الضوئي المستخدم من ناحية وبرنامج التعرف الضوئي على الحروف من ناحية أخرى، وفي هذه الحالة من الضروري تطابق وتوافق البرنامج مع معيار "TWAIN" المستخدم من جانب غالبية الماسحات الضوئية.3. واجهة المستفيد: تعتبر يمكن أن يخلق التصميم الشكلي الجذاب نوع من التحاور والتفاعل بين المستخدم من ناحية وبين البرنامج من ناحية أخرى، ومن بين الآليات التي تحتويها تلك البرمجيات بعض الأزرار التي تسمح عند الضغط عليها بواسطة "الفارة" القيام بالعديد من المهام، وذلك في أثناء عملية التعرف الضوئي للحروف في نص معين.4. القدرة على التعرف على الجداول: تعتبر إمكانية التعرف الشكلي والهيكلي للجداول خاصية مميزة لبعض فئات برمجيات "OCR"، ولهذا السبب من المفيد أن يكون البرنامج قادراً على اكتشاف وجود جداول في النص ومن ثم إعادة صياغتها في إحدى برمجيات معالجة النصوص.5. أشكال الحفظ والتخزين: من المعروف أن تسجيل البيانات والمعلومات المرقمنة في ملف يجب أن يكون وفقاً لشكل أو قالب أو امتداد معين وذلك بهدف إمكانية القراءة والإطلاع عليه في وقت لاحق، ولذلك فإن برمجيات "OCR" تتضمن أشكالاً مخصصة لتسجيل ومن ثم حفظ واسترجاع المعلومات في الملفات، ومن أهم هذه الأشكال : • "اسم الملف."DOC خاص ببرنامج معالج النصوص Microsoft Word• "اسم الملف."PDF خاص ببرنامج Adobe Reader التابع لشركة Adobe• "اسم الملف."XLS خاص ببرنامج Microsoft Excel• إلي غير ذلك...6. الالتزام بشكل النص الأصلي: يحقق الالتزام بشكل النص الأصلي إمكانية الحصول في صورة الكترونية على نفس التكوين الهيكلي والتنظيمي للصفحة الأصلية التي يتم رقمنتها ، إلي جانب استنساخ نفس الخصائص النصية من نوع الحرف وحجمه وشكله، وجسم النص، والأسلوب إلي غير ذلك.7. اللغات: كلما زادت وتعددت اللغات التي يمكن التعرف عليها كلما كانت برمجيات "OCR" أكثر قدرة على التعرف على النصوص المكتوبة بتلك اللغات المتنوعة.

ليست هناك تعليقات:

إرسال تعليق