GrabzIt चे वेब स्क्रॅपर वेबसाइटवरून ईमेल पत्ते काढणे सुलभ करण्यासाठी अनेक विशेष उपयुक्तता पद्धती प्रदान करते. खाली दिलेल्या उदाहरणास वेब पृष्ठावरील सर्व HTML सामग्री मिळते आणि ती त्याद्वारे पुढे जाते Utility.Text.extractAddresses पत्ते जतन करण्यापूर्वी सर्व वैध ईमेल पत्ते शोधण्याची पद्धत intओए डेटासेट, जो नंतर वापरकर्त्याला पाठविला जातो.
Utility.Text.extractAddresses
वैकल्पिकरित्या फक्त पहिला जुळणारा ईमेल पत्ता वापरुन काढला जाऊ शकतो Utility.Text.extractAddress पद्धत
Utility.Text.extractAddress
Data.save(Utility.Text.extractAddresses(Page.getHtml()));
पीडीएफ दस्तऐवज देखील स्क्रॅप केले जाऊ शकतात वर ईमेल पृष्ठे स्क्रॅप कसे केले जातात त्याच प्रकारे ईमेल पत्त्यांसाठी. आपण खाली दिलेल्या उदाहरणात पाहू शकता की त्याशिवाय प्रक्रिया अगदी समान आहे PDF.getText() त्याऐवजी पद्धत वापरली जाते Page.getHtml() पद्धत
PDF.getText()
Page.getHtml()
Data.save(Utility.Text.extractAddresses(PDF.getText()));
ग्रॅबझिटमध्ये क्षमता आहे प्रतिमांमधून मजकूर काढा याचा अर्थ असा की प्रतिमांचे ईमेल पत्ते काढण्यासाठी ही क्षमता देखील वापरली जाऊ शकते. खालील उदाहरण वेबपृष्ठावरील सर्व प्रतिमांचे कोणतेही ईमेल पत्ते काढते.
Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}))));
खाली स्क्रॅप सूचना पीडीएफ दस्तऐवजात सापडलेल्या प्रतिमांचे कोणतेही ईमेल अॅड्रॅसेस काढा.
Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(PDF.getValue({"type":"image"}))));