ब important्याचदा महत्त्वपूर्ण मजकूर माहिती प्रतिमांमध्ये संग्रहित केली जाऊ शकते. तथापि GrabzIt चे वेब स्क्रॅपर ऑप्टिकल कॅरेक्टर रिकग्निशन वापरून ही माहिती आपोआप काढण्याची क्षमता प्रदान करते. हे कलात्मक एक प्रकार आहे तरी intचिडखोर निकाल नेहमीच परिपूर्ण नसतात.
प्रतिमांमधून मजकूर काढण्यासाठी आपण हे वापरावे Utility.Image.extractText खाली दर्शविल्याप्रमाणे पद्धत.
Utility.Image.extractText
var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));
ही उदाहरणे दोन्ही वेबपृष्ठावरून सर्व प्रतिमा URL मिळवतात आणि नंतर URL च्या अर्क पाठ पद्धतीवर पाठवतात जी प्रत्येक प्रतिमेवरून मजकूर डेटा काढण्याचा प्रयत्न करते आणि कोणत्याही सामन्यास अॅरे म्हणून परत पाठवते strings.
प्रतिमेमधील मजकूर वेगळ्या भाषेमध्ये असल्यास खाली दर्शविल्याप्रमाणे आपल्याला दोन अक्षरे (आयएसओ एक्सएनयूएमएक्स-एक्सएनयूएमएक्स) स्वरूप वापरुन योग्य भाषा कोड निर्दिष्ट करणे आवश्यक आहे.
var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}), 'fr');