वेब कॅप्चर आणि रूपांतरित करण्यासाठी साधने

वेबसाइटवरील ईमेल पत्ते स्क्रॅप करा

पुढील दोन उदाहरणेही त्याचाच एक भाग आहेत साचा.

GrabzIt चे वेब स्क्रॅपर वेबसाइटवरून ईमेल पत्ते काढणे सुलभ करण्यासाठी अनेक विशेष उपयुक्तता पद्धती प्रदान करते. खाली दिलेल्या उदाहरणास वेब पृष्ठावरील सर्व HTML सामग्री मिळते आणि ती त्याद्वारे पुढे जाते Utility.Text.extractAddresses पत्ते जतन करण्यापूर्वी सर्व वैध ईमेल पत्ते शोधण्याची पद्धत intओए डेटासेट, जो नंतर वापरकर्त्याला पाठविला जातो.

वैकल्पिकरित्या फक्त पहिला जुळणारा ईमेल पत्ता वापरुन काढला जाऊ शकतो Utility.Text.extractAddress पद्धत

Data.save(Utility.Text.extractAddresses(Page.getHtml()));

पीडीएफ दस्तऐवजांकडील ईमेल पत्ते स्क्रॅप करा

पीडीएफ दस्तऐवज देखील स्क्रॅप केले जाऊ शकतात वर ईमेल पृष्ठे स्क्रॅप कसे केले जातात त्याच प्रकारे ईमेल पत्त्यांसाठी. आपण खाली दिलेल्या उदाहरणात पाहू शकता की त्याशिवाय प्रक्रिया अगदी समान आहे PDF.getText() त्याऐवजी पद्धत वापरली जाते Page.getHtml() पद्धत

Data.save(Utility.Text.extractAddresses(PDF.getText()));

प्रतिमांकडील ईमेल पत्ते स्क्रॅप करा

ग्रॅबझिटमध्ये क्षमता आहे प्रतिमांमधून मजकूर काढा याचा अर्थ असा की प्रतिमांचे ईमेल पत्ते काढण्यासाठी ही क्षमता देखील वापरली जाऊ शकते. खालील उदाहरण वेबपृष्ठावरील सर्व प्रतिमांचे कोणतेही ईमेल पत्ते काढते.

Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}))));

खाली स्क्रॅप सूचना पीडीएफ दस्तऐवजात सापडलेल्या प्रतिमांचे कोणतेही ईमेल अ‍ॅड्रॅसेस काढा.

Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(PDF.getValue({"type":"image"}))));