استخراج النص من PDF ممسوح ضوئياً — OCR مجاني داخل المتصفح
PDF الممسوح ضوئياً هو في جوهره صورة لورقة — ترى النص ولكن لا يمكنك تحديده أو البحث فيه أو نسخه. لجعله قابلاً للاستخدام تحتاج إلى OCR (التعرف الضوئي على الحروف). معظم أدوات OCR أونلاين تتطلب رفعاً وحساباً. إليك كيف تجري OCR مجاناً، بالكامل في متصفحك.
ماذا يفعل OCR فعلياً
OCR يحلل صورة كل صفحة، يحدد أشكال الحروف ويحولها إلى نص Unicode حقيقي. التنسيق الأصلي يُحفظ، النتيجة لا تزال تبدو كالمسح الضوئي لكن تحتها الآن نص قابل للبحث. مسح من 10 صفحات يُعالج في 10-30 ثانية حسب المعالج.
لماذا OCR في المتصفح أفضل من OCR في السحابة
خدمات OCR السحابية (حتى المجانية) ترفع مسحك إلى خوادمها. إذا كان المسح يحتوي على بطاقة هوية، إقرار ضريبي، أو عقد، فقد شاركته مع طرف ثالث. OCR في المتصفح يشغل محرك التعرف (Tesseract.js المُجمَّع إلى WebAssembly) بالكامل على جهازك — الملف لا يغادر متصفحك.
كيف تطبق OCR على PDF ممسوح في متصفحك
افتح أداة OCR، أسقط PDF الممسوح، اختر لغة المستند (العربية، الإنجليزية، الألمانية، الفرنسية، الإسبانية، الإيطالية، البرتغالية، الهولندية، البولندية، اليابانية، الكورية، الهندية، الصينية — وأكثر من 90 لغة أخرى) ثم انقر معالجة. الناتج هو PDF قابل للبحث يمكنك تنزيله. افتحه في أي عارض PDF واستخدم Ctrl+F للبحث.
نصيحة سريعة: دقة OCR تعتمد على جودة المسح. أعد المسح بدقة 300 DPI إذا خرج النص مشوهاً. قوّم الصفحات المائلة أولاً بأداة التدوير — حتى 5° من الانحراف يُضعف التعرف.
شغّل OCR على PDF الممسوح
مجاني، بدون رفع، يدعم أكثر من 100 لغة بما في ذلك العربية، الهندية، الصينية، اليابانية، الكورية.
افتح أداة OCR →