वेब कॅप्चर आणि रूपांतरित करण्यासाठी साधने

प्रतिमांमधून मजकूर काढा

ब important्याचदा महत्त्वपूर्ण मजकूर माहिती प्रतिमांमध्ये संग्रहित केली जाऊ शकते. तथापि GrabzIt चे वेब स्क्रॅपर ऑप्टिकल कॅरेक्टर रिकग्निशन वापरून ही माहिती आपोआप काढण्याची क्षमता प्रदान करते. हे कलात्मक एक प्रकार आहे तरी intचिडखोर निकाल नेहमीच परिपूर्ण नसतात.

प्रतिमांमधून मजकूर काढण्यासाठी आपण हे वापरावे Utility.Image.extractText खाली दर्शविल्याप्रमाणे पद्धत.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));

ही उदाहरणे दोन्ही वेबपृष्ठावरून सर्व प्रतिमा URL मिळवतात आणि नंतर URL च्या अर्क पाठ पद्धतीवर पाठवतात जी प्रत्येक प्रतिमेवरून मजकूर डेटा काढण्याचा प्रयत्न करते आणि कोणत्याही सामन्यास अ‍ॅरे म्हणून परत पाठवते strings.

प्रतिमेमधील मजकूर वेगळ्या भाषेमध्ये असल्यास खाली दर्शविल्याप्रमाणे आपल्याला दोन अक्षरे (आयएसओ एक्सएनयूएमएक्स-एक्सएनयूएमएक्स) स्वरूप वापरुन योग्य भाषा कोड निर्दिष्ट करणे आवश्यक आहे.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}), 'fr');