المعالجة الذكية للوثائق والتعرّف الضوئي OCR
حوِّل أكوام ملفّاتك العربية والفرنسية إلى بيانات مُهيكَلة وموثوقة وقابلة للاستثمار.
التحدّي
ترزح الإدارات والمصارف والمكاتب القانونية تحت وطأة وثائق ورقية أو ممسوحة ضوئياً: عقود، وصكوك، ونماذج، وكشوف، وملفّات الأحوال المدنية. الإدخال اليدوي بطيء ومكلف وعرضة للأخطاء، بينما تبقى المعلومة حبيسة صور لا تستطيع الأنظمة استثمارها.
وتتفاقم الصعوبة بالثنائية اللغوية عربية/فرنسية، والخطّ العربي المتّصل المتشابك، والتخطيطات المعقّدة (جداول، أختام، توقيعات بخطّ اليد)، وجودة المسح المتفاوتة. تفشل أنظمة OCR العامة في العربية ولا تفهم البنية المنطقية للوثائق.
منهجيتنا
تبني ADST سلسلة معالجة وثائقية من طرف إلى طرف. نبدأ بـفهم التخطيط باستخدام نماذج من نوع LayoutLM تحدّد كتل النصّ والجداول ومناطق التوقيع والحقول المفتاحية، حتى على الوثائق المتدهورة.
ثم يأتي OCR ثنائي اللغة مُكيَّف خصيصاً للعربية المتّصلة والفرنسية، يليه استخراج المعلومات بواسطة نموذج لغوي كبير: يقرأ النموذج اللغوي النصّ المُتعرَّف عليه ويستخرج الكيانات المُهيكَلة (الأطراف، والمبالغ، والتواريخ، والبنود)، مع درجة ثقة لكل حقل والتحقّق بقواعد العمل.
تُوجَّه الحالات غير المؤكَّدة إلى مراجعة بشرية عبر واجهة مخصّصة، ويُغذّي كل تصحيح التحسين المستمر. تتكامل النتيجة مع أنظمتكم (إدارة المحتوى، النظام المصرفي الأساسي، تخطيط الموارد) عبر واجهة برمجية، مع خفض جذري لآجال المعالجة وقابلية تتبّع كاملة.
البنية التقنية
- تحليل التخطيط: نماذج LayoutLM / Document Transformer متعدّدة الوسائط
- OCR: محرّكات مُحسَّنة للعربية المتّصلة والفرنسية، مع تصحيح لاحق للتعرّف
- الاستخراج: نموذج لغوي كبير بمخرجات مُهيكَلة (JSON)، والتحقّق بالقواعد والمخطّط
- الإنسان ضمن الحلقة: طابور مراجعة الحقول منخفضة الثقة، والتعلّم المستمر
تخفّض إدارة عامة زمن معالجة ملفّاتها بنسبة 85% وتعيد توظيف موظّفيها في مهام ذات قيمة أعلى.