वेबसाइटवरून दुवे काढणे हे एक सामान्य कार्य आहे, विशेषत: एचटीएमएल दुवे. सुदैवाने वापरताना हे सोपे आहे GrabzIt चे वेब स्क्रॅपर. सर्वप्रथम स्क्रॅपचे प्रारंभिक पृष्ठ आणि इतर कोणत्याही पर्यायांसारख्या सामान्य तपशीलांसह एक नवीन स्क्रॅप तयार करा.
मग जा स्क्रॅप सूचना टॅबवर क्लिक करा आणि बटण. हे प्रविष्ट करेल Page कीवर्ड into स्क्रॅप सूचना आणि एक ड्रॉप डाउन उघडेल. निवडा getTagAttributes यादीतून. पुढील जोडा 'href' प्रथम मापदंड म्हणून, हे वेब स्क्रॅपरला href गुणधर्म काढण्यास सांगते, नंतर स्वल्पविराम टाइप करा.
Page
getTagAttributes
'href'
पुढे क्लिक करा हे आपल्याला वेब स्क्रॅपरला सांगण्यास परवानगी देते की कोणत्या घटकांमधून href गुणधर्म मिळवायचे. फिल्टर विंडोमध्ये हे सुनिश्चित करा की 'वेब पृष्ठ' वर प्रकार सेट केला गेला आहे आणि निर्बंध 'टॅग नाव' आणि 'समान' आहेत. मग एंटर करा a मजकूर बॉक्समध्ये आणि नंतर जोडा बटणावर क्लिक करा आणि नंतर फिल्टर बटण घाला. ओळीच्या शेवटी अर्ध-कोलन जोडून सूचना समाप्त करा.
a
आपल्याला खाली दर्शविल्यासारखे काहीतरी सोडले पाहिजे.
Page.getTagAttributes('href', {"tag":{"equals":"a"}});
उपरोक्त कोड वेब पृष्ठावरील सर्व दुवे URL काढेल, परंतु आम्हाला आता हे आवश्यक आहे save त्या दुवा URL च्या. हे करण्यासाठी आपण कमांड वजा अर्धविराम a मध्ये लपेटू Data.save आज्ञा. हे करण्यासाठी ओळीच्या सुरुवातीस जा आणि निवडा बटण. ड्रॉप डाऊन मध्ये सिलेक्ट करा save, नंतर ओळीच्या शेवटी जा आणि स्वल्पविराम जोडा. नंतर आपल्याला 'माझी वेबसाइट' सारख्या डेटासेटला कॉल करण्यासाठी काय जोडायचे ते जोडा, नंतर आणखी एक स्वल्पविराम जोडा आणि नंतर दुवे म्हणून लिंक्स सारखे वर्णन करण्यासाठी आणखी एक पॅरामीटर जोडा आणि नंतर कमांड बंद करून बंद करा. ) अर्धविराम करण्यापूर्वी
Data.save
save
)
आपल्याकडे आता खालील स्क्रॅप सूचना असतील.
Data.save(Page.getTagAttributes('href', {"tag":{"equals":"a"}}), 'My Websites', 'Links');
आता आपण स्क्रॅप चालवत असल्यास आपण वेबसाइटवरील सर्व दुवे काढू शकाल. हे माझ्या वेबसाइट्सच्या नावाने एक दुवे तयार करेल ज्याच्या दुव्याच्या स्तंभ नावाने ती निर्यात केली जाऊ शकतात intएक्स एक्सएमएल, सीएसव्ही किंवा स्प्रेडशीट सारख्या अनेक भिन्न स्वरूपने. स्क्रॅप इंस्ट्रक्शन्स टूलबारमधील विझार्ड बटणाचा वापर करून हे ट्यूटोरियल देखील प्राप्त केले जाऊ शकते.