एक पीडीएफ दस्तावेज़ या एक छवि है जिसे आप पाठ में कनवर्ट करना चाहते हैं? हाल ही में, किसी ने मुझे मेल में एक दस्तावेज़ भेजा है जिसे मुझे संपादित करने और सुधार के साथ वापस भेजने की आवश्यकता है। व्यक्ति डिजिटल प्रतिलिपि का पता नहीं लगा सका, इसलिए मुझे उस पाठ को डिजिटल प्रारूप में प्राप्त करने का काम सौंपा गया।
कोई रास्ता नहीं था कि मैं सब कुछ वापस टाइप करने में घंटों खर्च करने जा रहा था, इसलिए मैंने इसे समाप्त कर लिया दस्तावेज की एक अच्छी उच्च गुणवत्ता वाली तस्वीर और फिर ऑनलाइन ओसीआर सेवाओं के समूह के माध्यम से अपना रास्ता जला दिया ताकि यह देखने के लिए कि कौन मुझे सबसे अच्छा परिणाम देगा।
इस लेख में, मैं एक जोड़े के माध्यम से जाऊंगा ओसीआर के लिए मेरी पसंदीदा साइटों में से जो निःशुल्क हैं। यह ध्यान देने योग्य है कि इनमें से अधिकतर साइटें मूलभूत सेवा प्रदान करती हैं और फिर यदि आप बड़ी छवियों, बहु पृष्ठ पीडीएफ दस्तावेज़ों, विभिन्न इनपुट भाषाओं आदि जैसी अतिरिक्त सुविधाएं चाहते हैं तो भुगतान विकल्प हैं।
यह भी अच्छा है पहले से पता है कि इनमें से अधिकतर सेवाएं आपके मूल दस्तावेज़ के स्वरूपण से मेल नहीं खा पाएंगी। ये मुख्य रूप से पाठ निकालने के लिए हैं और यही वह है। यदि आपको किसी विशिष्ट लेआउट या प्रारूप में होने की आवश्यकता है, तो आपको OCR से सभी टेक्स्ट प्राप्त करने के बाद मैन्युअल रूप से ऐसा करना होगा।
इसके अतिरिक्त, टेक्स्ट प्राप्त करने के लिए सर्वोत्तम परिणाम आएंगे 200 से 400 डीपीआई संकल्प वाले दस्तावेज़ों से। यदि आपके पास कम डीपीआई छवि है, तो परिणाम उतने अच्छे नहीं होंगे।
आखिरकार, मैंने कई साइटों का परीक्षण किया जो अभी काम नहीं कर पाए। यदि आप Google मुफ्त ऑनलाइन ओसीआर देखते हैं, तो आपको साइट्स का एक गुच्छा दिखाई देगा लेकिन शीर्ष 10 परिणामों में से कई साइटों ने रूपांतरण को पूरा नहीं किया है। कुछ समय निकाल देंगे, अन्य त्रुटियां देंगे और कुछ "कनवर्टिंग" पेज पर फंस गए हैं, इसलिए मैंने उन साइटों का उल्लेख करने के लिए भी परेशान नहीं किया।
प्रत्येक साइट के लिए, मैंने दो दस्तावेजों का परीक्षण किया आउटपुट कितना अच्छा होगा। मेरे परीक्षणों के लिए, मैंने बस अपने आईफोन 5 एस का उपयोग दोनों दस्तावेजों की तस्वीर लेने के लिए किया और फिर उन्हें सीधे रूपांतरण के लिए वेबसाइटों पर अपलोड किया।
यदि आप देखना चाहते हैं कि छवियों की तरह क्या दिखता है मेरा परीक्षण, मैंने उन्हें यहां संलग्न किया है: test1 और test2 । ध्यान दें कि ये फोन से ली गई छवियों का पूर्ण रिज़ॉल्यूशन संस्करण नहीं हैं। साइट पर अपलोड करते समय मैंने पूर्ण रिज़ॉल्यूशन छवि का उपयोग किया।
OnlineOCR
OnlineOCR.net एक स्वच्छ और सरल साइट है जिसने मेरे परीक्षण में बहुत अच्छे परिणाम दिए हैं। मुख्य बात यह है कि मुझे इसके बारे में पसंद है कि इस जगह पर बहुत सारे विज्ञापन नहीं हैं, जो आम तौर पर इन प्रकार की विशिष्ट सेवा साइटों के मामले में होता है।
प्रारंभ करने के लिए, अपनी फ़ाइल का चयन करें और अपलोड होने तक प्रतीक्षा करें। इस साइट के लिए अधिकतम अपलोड आकार 100 एमबी है। यदि आप एक मुफ्त खाते के लिए पंजीकरण करते हैं, तो आपको कुछ अतिरिक्त सुविधाएं जैसे बड़े अपलोड आकार, बहु पृष्ठ पीडीएफ, विभिन्न इनपुट भाषाएं, प्रति घंटे अधिक रूपांतरण आदि मिलती हैं।
अगला, अपनी इनपुट भाषा चुनें और फिर आउटपुट प्रारूप का चयन करें। आप वर्ड, एक्सेल, या सादा पाठ से चुन सकते हैं। कनवर्ट करेंबटन पर क्लिक करें और आपको डाउनलोड लिंक के साथ बॉक्स में नीचे दिए गए टेक्स्ट को दिखाई देगा।
यदि आप चाहते हैं कि पाठ है, तो बस इसे बॉक्स से कॉपी और पेस्ट करें। हालांकि, मेरा सुझाव है कि आप वर्ड डॉक्यूमेंट डाउनलोड करें क्योंकि यह मूल दस्तावेज के लेआउट को रखने का एक आश्चर्यजनक काम है।
उदाहरण के लिए, जब मैंने अपने दूसरे टेस्ट के लिए वर्ड डॉक्यूमेंट खोला, तो मुझे आश्चर्य हुआ यह पता लगाएं कि दस्तावेज़ में छवि के समान तीन कॉलम वाली एक तालिका शामिल है।
सभी साइटों में से, यह सबसे अच्छा था से दूर। अगर आपको बहुत सारे रूपांतरण करने की ज़रूरत है तो यह पूरी तरह से पंजीकरण करने योग्य है।
पूर्णता के लिए, मैं प्रत्येक सेवा द्वारा बनाई गई आउटपुट फ़ाइलों से लिंक करने जा रहा हूं ताकि आप अपने लिए परिणाम देख सकें। यहां ऑनलाइनOCR के परिणाम दिए गए हैं: टेस्ट 1 डॉक्टर और टेस्ट 2 डॉक्टर ।
ध्यान दें कि आपके कंप्यूटर पर इन Word दस्तावेज़ों को खोलते समय, आपको एक संदेश मिलेगा शब्द यह बताता है कि यह इंटरनेट और संपादन से अक्षम कर दिया गया है। यह पूरी तरह से ठीक है क्योंकि शब्द इंटरनेट से दस्तावेज़ों पर भरोसा नहीं करता है और यदि आप दस्तावेज़ को देखना चाहते हैं तो आपको वास्तव में संपादन को सक्षम करने की आवश्यकता नहीं है।
i2OCR
एक और साइट बहुत अच्छा परिणाम दिया i2OCR था। प्रक्रिया बहुत समान है: अपनी भाषा, फ़ाइल चुनें, और फिर टेक्स्ट निकालेंदबाएं।
आप करेंगे यहां एक या दो मिनट का इंतजार करना है क्योंकि इस साइट को थोड़ा अधिक समय लगता है। साथ ही, चरण 2 में, सुनिश्चित करें कि आपकी छवि पूर्वावलोकन में दायीं ओर दिखाई दे रही है, अन्यथा आपको आउटपुट के रूप में गड़बड़ी का एक गुच्छा मिलेगा। किसी कारण से, मेरे आईफोन की छवियां मेरे कंप्यूटर पर पोर्ट्रेट मोड में दिखाई दे रही थीं, लेकिन जब मैंने इस साइट पर अपलोड किया था तो परिदृश्य।
I एक फोटो संपादन एप में छवि को मैन्युअल रूप से खोलना था, इसे 90 डिग्री घुमाएं, फिर उसे पोर्ट्रेट पर घुमाएं और फिर इसे फिर से सहेजें। एक बार पूरा हो जाने पर, नीचे स्क्रॉल करें और यह आपको डाउनलोड बटन के साथ टेक्स्ट का पूर्वावलोकन दिखाएगा।
यह साइट पहले परीक्षण के आउटपुट के साथ बहुत अच्छी तरह से दिख रही थी, लेकिन ऐसा नहीं हुआ कॉलम लेआउट वाला दूसरा परीक्षण। I2OCR के परिणाम यहां दिए गए हैं: टेस्ट 1 डॉक्टर और टेस्ट 2 डॉक्टर ।
फ्रीओसीआर
Free-OCR.com ले जाएगा अपनी छवियों और उन्हें सादे पाठ में परिवर्तित करें। इसमें वर्ड प्रारूप में निर्यात करने का विकल्प नहीं है। अपनी फ़ाइल चुनें, एक भाषा का चयन करें और फिर प्रारंभ करेंक्लिक करें।
साइट तेज़ है और आपको आउटपुट काफी तेज़ी से मिल जाएगा। बस अपने कंप्यूटर पर टेक्स्ट फ़ाइल डाउनलोड करने के लिए लिंक पर क्लिक करें।
जैसा कि नीचे उल्लिखित न्यूओसीआर के साथ है, यह साइट सभी टी के को कैपिटल करती है दस्तावेज़। मुझे नहीं पता कि यह ऐसा क्यों करेगा, लेकिन कुछ अजीब कारणों से इस साइट और न्यूओसीआर ने यह किया। इसे बदलने के लिए यह एक बड़ा सौदा नहीं है, लेकिन यह एक कठिन प्रक्रिया है जिसे आपको वास्तव में नहीं करना चाहिए।
यहां फ्रीओआरआर के परिणाम हैं: टेस्ट 1 डॉक्टर और टेस्ट 2 डॉक्टर ।
ABBYY FineReader Online
FineReader ऑनलाइन का उपयोग करने के लिए, आपको एक खाते के लिए पंजीकरण करना होगा, जो आपको 15 दिन का दिन लेता है मुक्त करने के लिए 10 पृष्ठों तक ओसीआर के लिए नि: शुल्क परीक्षण। यदि आपको केवल कुछ पृष्ठों के लिए एक बार ओसीआर करने की आवश्यकता है, तो आप इस सेवा का उपयोग कर सकते हैं। सुनिश्चित करें कि आप पंजीकरण के बाद पुष्टिकरण ईमेल में सत्यापित लिंक पर क्लिक करें।
शीर्ष पर पहचानेंपर क्लिक करें और फिर अपनी फ़ाइल का चयन करने के लिए अपलोड करेंक्लिक करें। अपनी भाषा, आउटपुट प्रारूप चुनें और फिर नीचे पहचानेंक्लिक करें। इस साइट पर एक साफ इंटरफ़ेस है और कोई भी विज्ञापन नहीं है।
मेरे परीक्षणों में, यह साइट पहले टेस्ट दस्तावेज़ से टेक्स्ट को पकड़ने में सक्षम थी, लेकिन जब मैंने वर्ड डॉक खोला तो यह बिल्कुल बड़ा था, इसलिए मैं इसे फिर से समाप्त करना और सादा पाठ को आउटपुट प्रारूप के रूप में चुनना।
कॉलम के साथ दूसरे परीक्षण के लिए, शब्द दस्तावेज़ खाली था और मुझे टेक्स्ट भी नहीं मिला। निश्चित नहीं है कि वहां क्या हुआ, लेकिन ऐसा लगता है कि यह सरल पैराग्राफ के अलावा कुछ भी संभाल नहीं सकता है। FineReader के परिणाम यहां दिए गए हैं: test1 डॉक्टर और टेस्ट 2 डॉक्टर ।
newOCR
अगली साइट, 21एस>, ठीक था, लेकिन पहली साइट के रूप में लगभग उतना ही अच्छा नहीं था। सबसे पहले, यह विज्ञापन मिल गया है, लेकिन शुक्र है कि एक टन नहीं। आप पहले अपनी फ़ाइल का चयन करें और फिर पूर्वावलोकनबटन क्लिक करें।
फिर आप छवि को घुमा सकते हैं और समायोजित कर सकते हैं क्षेत्र जहां आप पाठ के लिए स्कैन करना चाहते हैं। स्कैनिंग प्रक्रिया एक कंप्यूटर पर एक संलग्न स्कैनर के साथ काम करने की तरह बहुत सुंदर है।
यदि दस्तावेज़ में एकाधिक कॉलम हैं, तो आप कर सकते हैं पृष्ठ लेआउट विश्लेषणबटन की जांच करें और यह टेक्स्ट को कॉलम में विभाजित करने का प्रयास करेगा। ओसीआर बटन पर क्लिक करें, इसे पूरा करने के लिए कुछ सेकंड प्रतीक्षा करें और फिर पेज रीफ्रेश होने पर नीचे स्क्रॉल करें।
पहले टेस्ट में, यह सभी टेक्स्ट सही ढंग से मिला, लेकिन किसी कारण से प्रत्येक को पूंजीकृत दस्तावेज़ में टी! कोई विचार नहीं कि यह ऐसा क्यों करेगा, लेकिन ऐसा हुआ। पृष्ठ विश्लेषण सक्षम के साथ दूसरे परीक्षण में, इसे अधिकांश टेक्स्ट मिला, लेकिन लेआउट पूरी तरह से बंद था।
यहां न्यूओसीआर के परिणाम हैं: टेस्ट 1 डॉक्टर और टेस्ट 2 डॉक्टर ।
निष्कर्ष
जैसा कि आप देख सकते हैं, मुफ़्त में आपको दुर्भाग्यवश अधिकांश समय वास्तव में बहुत अच्छे नतीजे नहीं मिलते हैं। उल्लिखित पहली साइट अब तक का सबसे अच्छा है क्योंकि न केवल यह सभी पाठ को पहचानने का एक अच्छा काम करता है, बल्कि यह मूल दस्तावेज़ के स्वरूप को बनाए रखने में भी कामयाब रहा।
यदि आपको केवल टेक्स्ट की आवश्यकता है, हालांकि , उपर्युक्त वेबसाइटों में से अधिकांश आपके लिए ऐसा करने में सक्षम होना चाहिए। यदि आपके कोई प्रश्न हैं, तो टिप्पणी करने के लिए स्वतंत्र महसूस करें। का आनंद लें!