الأحد، 17 مايو 2009

تقنية OCR


كما نعلم أن العديد من المؤسسات العلمية والثقافية خصوصا دور البحوث والدراسات تقوم بالعديد من عمليات الأرشفة اليومية بشكل يدوي أم باستخدام الحاسوب الآلي، وقد بدأت منذ فترة ليست ببعيدة بانتهاج أسلوب القراءة الآلية للنصوص حتى تقوم بمساندتهم في مجال الأرشفة، ولا يمكن القول أنها تعتمد كليا عليها وذلك بسبب بعض الصعوبات التي ما زالت تواجه تلك التقنية خصوصا عند استخدامها للقراءة الآلية للنصوص العربية في وقتنا الحاضر، فكيف تعمل تلك التقنية وما فوائدها وسلبياتها؟
تعرف ال OCR بتقنية التعرف الضوئي أو التعرف الآلي على الحروف بشكل عام مع إمكانية دعمها للعديد من اللغات المعروفة وهي اختصار ل Optical Character Recognition
وتختص برمجيات التعرف الضوئي على الحروف بالقيام بمجموعة من العمليات والخطوات التي تستهدف التعرف وقراءة نص معين أثناء إجراء عملية المسح الضوئي له، وتقوم بالتعرف على محتويات النص حرف عبر حرف وكلمة عبر كلمة ومن ثم تحويله إلى ملف نصي يتضمن على بيانات ومعلومات مكودة في شكل معيار(American Standard Code for Information Interchange) ASCII أو معيار Unicode والذي يحتل غالباً مساحة أقل من تلك التي يحتاج إليها ملف الصور.

Optical Character Recognition المفروض أن يكون التعرف علي الحروف باستخدام أداة ضوئية Optical Instrument كالعدسات والمرايا , وهذا يختلف عن ال Digital Character Recognition أي التعرف علي الحروف رقميا .. لكن كلاهما يحملان نفس المعني الآن ..[1]
[1] مجلة الفريق العربي 2000 http://www.arabteam2000-forum.com/index.php?showtopic=89769 "27-3-1430 هـ"

تطبيقات تعمل بتقنية التعرف الضوئي على الحروف


برنامج القارئ الآلي (صخر) Sakhr Automatic Reader: يعتبر من التطبيقات الرائدة في مجال التعريف الضوئي ومن أولى الشركات التي قامت بالتعامل مع اللغة العربية والفارسية.تطبيق Omni Page: يعتبر من التطبيقات القديمة جدا، ولكنه لا يدعم اللغة العربية، مع إمكانية دعم العديد من اللغات الأخرى.تطبيق ABBYY Fine Reader: الذي اشتهر في فترات سابقة وأصبح يلاقي العديد من التطوير والنتائج الرائعة في العمل تحت بيئة اللغات المتعددة ولكنه غير قادر على اعطاء مخارج الأحرف العربية بشكل محترف.تطبيق Read iris: يعتبر من التطبيقات المنافسة لتطبيقات صخر، حيث الأدوات المستخدمة فيه متطورة جدا وسهولة في التعامل مع المستخدم وإلحاقها ببرامج عدة مع إضافة لبعض الأساليب الذكية في التعامل.تطبيق Cuneiform OCR: وهو من التطبيقات التي تعمل بكفاءة عالية لجميع اللغات، ولكنه لا يدعم اللغة العربية.تطبيق APKeeper Pro: أحد التطبيقات التي تدعم اللغة الانكليزية فقط ولا تدعم اللغة العربية.

معايير اختيار برمجيات OCR

يعتمد اختيار المكتبات ومؤسسات المعلومات لبرمجيات التعرف الضوئي على الحروف في الأساس على مدى صلاحيتها للاستخدام والتطبيق، واشتمالها على قواميس متخصصة غنية وثرية بمفردات المحتوى الموضوعي لنصوص مصادر المعلومات التي يمكن معالجتها بواسطة مثل هذه البرمجيات. وتتضمن معايير الاختيار بالإضافة إلى ذلك مجموعة الإجراءات والآليات المتبعة في التعرف على الحروف والسرعة في قراءتها، وأنواع وأحجام وأشكال الحروف التي يمكن التعرف عليها، واللغات التي تحتويها البرمجيات ويمكن التعامل معها، وأساليب وأنماط عرض وإتاحة النصوص بعد إتمام عملية التعرف عليها، وأن تتضمن تقنيات التعرف الضوئي على بعض المهام المتقدمة منها على سبيل المثال إمكانية التدقيق الإملائي والتوافق مع برمجيات التحرير والنشر وأخيراً يعتبر عامل السعر من العوامل التي يمكن أن تؤخذ في الاعتبار.ويتوافر في ضوء هذه المعايير فئتين من تطبيقات التعرف الضوئي للحروف والتي يتم استخدامها بشكل مستمر في رقمنة مجموعات مصادر معلومات المكتبات الكبرى خاصة الوطنية وهما برنامج "OmniPage Pro" وبرنامج "WordScan". وقد ساعد برنامج"Adobe Capture" على زيادة قيمة هذين البرنامجين وذلك لما له من قدرة عالية على معالجة النصوص ذات التنسيق المعقد، ولعل ذلك يأتي نتيجة استخدام شكل (Portable Document Format) PDF الذي يُمكن من الاحتفاظ بالتنسيق الخاص بالنصوص الأصلية.وإلي جانب مجموعة المعايير السابق ذكرها والخاصة باختيار برمجيات "OCR"، تتوافر سلسلة أخرى من المعايير الهامة والتي يمكن أخذها في الاعتبار ومنها على سبيل المثال:1. الدقة: ويمكن تقدير معدل الدقة من خلال التعرف على نسبة الأخطاء الناجمة عن إجراء القراءة الضوئية للنصوص، ويمكن قياس معدل دقة البرنامج عبر النسبة المئوية للكلمات
2. التطابق والتوافق مع أجهزة المسح الضوئي المتنوعة: من المهم التحقق من نوع أجهزة الماسحات الضوئية التي يمكن أن تتعامل معها برمجيات "OCR"، أي ضرورة التوافق بين جهاز الماسح الضوئي المستخدم من ناحية وبرنامج التعرف الضوئي على الحروف من ناحية أخرى، وفي هذه الحالة من الضروري تطابق وتوافق البرنامج مع معيار "TWAIN" المستخدم من جانب غالبية الماسحات الضوئية.3. واجهة المستفيد: تعتبر يمكن أن يخلق التصميم الشكلي الجذاب نوع من التحاور والتفاعل بين المستخدم من ناحية وبين البرنامج من ناحية أخرى، ومن بين الآليات التي تحتويها تلك البرمجيات بعض الأزرار التي تسمح عند الضغط عليها بواسطة "الفارة" القيام بالعديد من المهام، وذلك في أثناء عملية التعرف الضوئي للحروف في نص معين.4. القدرة على التعرف على الجداول: تعتبر إمكانية التعرف الشكلي والهيكلي للجداول خاصية مميزة لبعض فئات برمجيات "OCR"، ولهذا السبب من المفيد أن يكون البرنامج قادراً على اكتشاف وجود جداول في النص ومن ثم إعادة صياغتها في إحدى برمجيات معالجة النصوص.5. أشكال الحفظ والتخزين: من المعروف أن تسجيل البيانات والمعلومات المرقمنة في ملف يجب أن يكون وفقاً لشكل أو قالب أو امتداد معين وذلك بهدف إمكانية القراءة والإطلاع عليه في وقت لاحق، ولذلك فإن برمجيات "OCR" تتضمن أشكالاً مخصصة لتسجيل ومن ثم حفظ واسترجاع المعلومات في الملفات، ومن أهم هذه الأشكال : • "اسم الملف."DOC خاص ببرنامج معالج النصوص Microsoft Word• "اسم الملف."PDF خاص ببرنامج Adobe Reader التابع لشركة Adobe• "اسم الملف."XLS خاص ببرنامج Microsoft Excel• إلي غير ذلك...6. الالتزام بشكل النص الأصلي: يحقق الالتزام بشكل النص الأصلي إمكانية الحصول في صورة الكترونية على نفس التكوين الهيكلي والتنظيمي للصفحة الأصلية التي يتم رقمنتها ، إلي جانب استنساخ نفس الخصائص النصية من نوع الحرف وحجمه وشكله، وجسم النص، والأسلوب إلي غير ذلك.7. اللغات: كلما زادت وتعددت اللغات التي يمكن التعرف عليها كلما كانت برمجيات "OCR" أكثر قدرة على التعرف على النصوص المكتوبة بتلك اللغات المتنوعة.

فكرة عمل التعرف الضوئي على الحروف :


أن الماسح الضوئي يقوم بتحويل الوثيقة إلى صورة عند إنشاء عملية مسح شامل لها، ويقوم بسؤال المستخدم بأي شكل يريد تلك الصورة، هل تكون ملونة أم باللونين الأبيض والأسود، ومن ثم تخزينها بالحاسوب، ويجب أن نذكر هنا أن الدور الأساسي الذي يلعبه هنا هو التطبيق المسئول عن ذلك وليس الماسح الضوئي، ولكن أجهزة المسح بات لها دورا مساندا للعمل مع تلك التقنية، فبدأت الشركات بتصنيع ماسحات ضوئية فائقة الدقة، وتكون تلك الماسحات مختلفة السعر من الزهيد إلى الباهظ (حسب دقتها) وللبحث عن أفضلها يجب معرفة دقة ال DPI التي تستخدمه وهي اختصار لكلمة Dot Per Inch، فكلما زادت القيمة لها أصبحت الدقة عالية بالصورة أو الوثيقة المستخدمة في المسح الضوئي
ولا ننسى أن الصورة الناتجة عن ذلك المسح الضوئي ناتجها يكون عبارة عن صورة فقط لا غير، أشكالا فقط، هذا ما يفهمه الحاسوب، فما الذي قام به المخترعون لتلك التقنية، حقيقة، لقد أوجدوا الطريقة التي قام بها التطبيق المعروف بالتعريف الضوئي بتحويل النصوص التي هي عبارة عن أشكال في بادئ الأمر (من الوثيقة الأصلية) إلى أرقام ورموز يمكن التعامل معها من خلال إمكانية التنقيح الكامل من تعديل وإضافة وإلغاء وغيره الكثير.[1]
[1] الكسناوي , اسامة , التعرف الضوئي والالي على الحروف بتقنية ال OCR جريدة القبس العدد 12424 - تاريخ النشر 03/01/ 2008 متاح على http://www.alqabas.com.kw/Article.aspx?id=347361 "8-4-1430 هـ"

تاريخ ال OCR :

1- عام 1950 طلب Frank Rowlett من David Sheppard أن يعمل مع Louis Tortilla كي يتم تحويل الرسائل المطبوعة إلي لغة الآلة كي يتم التعامل معها كنصوص Text ....وبدأ David Sheppard وعمل آلة سماها Gismo ولكن مشكلتها إن الكتابة يجب ان تكون عرضية و مضبوطة لكي تستطيع الآلة ان تقرأها ....2- عام 1953 جاء Sheppard بالتطوير الجديد وهو تأسيس مؤسسة اسمها Intelligent Machines Research Corporation أو ال IMR والتي قدمت نظم OCR تستخدم للأغراض التجارية ...وقد تميز نظام ال IMR بأنه يستطيع التعرف علي الحروف في أي مكان من الصورة .3- عام 1955 تم استخدام ال OCR في غرض تجاري في مجلة ال Readers Digest لأول مرة ... وتم بيع النظام الثاني ل Standard Oil Company في كاليفورنيا وكذلك العديد من شركات البترول بعدها .4- في أواخر الخمسينيات تم استخدام النظام من قبل إحدى شركات خدمات التليفون والبريد وهى شركة Ohio Bell Telephone Company وكذلك تم بيعها للقوات الجوية الأمريكية التي استخدمتها في الاتصالات ....5- في عام 1965 استخدمت شركة الولايات المتحدة لخدمات البريد United States Postal Service تقنية ال OCR لتفرز رسائل البريد الواردة وذلك باستخدام أحد الابتكارات لشخص اسمه Jacob Rabinow .6- عام 1971 بدأ البريد الكندي Canada Post في استخدام ال OCR .استخدام ال OCR في البريد كان يعتمد علي mechanism محددة وهي قراءة الاسم والعنوان ثم طباعة Bar Code مناسب علي المظروف .. هذا ال Bar Code يحتوي علي ال Postal Code الخاص بالعنوان المقصود ... وبهذا يتم توجيه الرسالة إلي العنوان بناءا علي هذا ال Bar Code .... لكنهم وجدوا أن هذه التقنية مكلفة نوعا ما لأنها تعتمد إلا علي ال Bar Code كان هذا هو التطور في استخدام ال OCR .[1]
[1] مجلة الفريق العربي 2000 http://www.arabteam2000-forum.com/index.php?showtopic=89769 "27-3-1430 هـ"