स्कैन PDF से टेक्स्ट निकालें — मुफ्त ब्राउज़र OCR
स्कैन PDF असल में कागज़ की एक तस्वीर है — आप टेक्स्ट देख सकते हैं, लेकिन सिलेक्ट, सर्च या कॉपी नहीं कर सकते। इसे उपयोग करने योग्य बनाने के लिए OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) चाहिए। ज़्यादातर ऑनलाइन OCR टूल अपलोड और अकाउंट माँगते हैं। यहाँ है पूरी तरह ब्राउज़र में मुफ्त OCR करने का तरीका।
OCR वास्तव में क्या करता है
OCR हर पेज इमेज को स्कैन करता है, अक्षरों के आकार पहचानता है और उन्हें असली Unicode टेक्स्ट में बदल देता है। मूल लेआउट संरक्षित रहता है, परिणाम स्कैन जैसा ही दिखता है लेकिन नीचे अब सर्च करने योग्य टेक्स्ट है। 10-पेज का स्कैन आपके CPU के अनुसार 10-30 सेकंड में प्रोसेस होता है।
ब्राउज़र OCR क्यों क्लाउड OCR से बेहतर है
क्लाउड OCR सेवाएं (मुफ्त भी) आपके स्कैन किए दस्तावेज़ को अपने सर्वर पर अपलोड करती हैं। अगर स्कैन में आधार कार्ड, टैक्स फॉर्म या कॉन्ट्रैक्ट है, आपने इसे किसी तीसरे पक्ष के साथ साझा कर दिया है। ब्राउज़र OCR रिकग्निशन इंजन (WebAssembly में कंपाइल किया गया Tesseract.js) पूरी तरह आपके डिवाइस पर चलाता है — फाइल ब्राउज़र छोड़ती ही नहीं।
ब्राउज़र में स्कैन PDF को OCR कैसे करें
OCR टूल खोलें, अपना स्कैन PDF ड्रॉप करें, दस्तावेज़ की भाषा चुनें (हिन्दी, अंग्रेज़ी, जर्मन, फ्रेंच, स्पेनिश, इतालवी, पुर्तगाली, डच, पोलिश, जापानी, कोरियाई, अरबी, चीनी — और 90+ अन्य) और प्रोसेस पर क्लिक करें। आउटपुट एक सर्च करने योग्य PDF है जिसे आप डाउनलोड कर सकते हैं। किसी भी PDF व्यूअर में खोलें और सर्च के लिए Ctrl+F का उपयोग करें।
त्वरित सुझाव: OCR की सटीकता स्कैन क्वालिटी पर निर्भर करती है। अगर टेक्स्ट गलत निकले, 300 DPI पर दोबारा स्कैन करें। तिरछे पेजों को पहले Rotate टूल से सीधा करें — 5° का झुकाव भी पहचान कमज़ोर कर देता है।
अपने स्कैन PDF पर OCR चलाएं
मुफ्त, कोई अपलोड नहीं, अरबी, हिन्दी, चीनी, जापानी, कोरियाई समेत 100+ भाषाएँ।
OCR टूल खोलें →