वेबसाइटवरून दुवे काढणे हे एक सामान्य कार्य आहे, विशेषत: एचटीएमएल दुवे. सुदैवाने वापरताना हे सोपे आहे GrabzIt चे वेब स्क्रॅपर. सर्वप्रथम स्क्रॅपचे प्रारंभिक पृष्ठ आणि इतर कोणत्याही पर्यायांसारख्या सामान्य तपशीलांसह एक नवीन स्क्रॅप तयार करा.
मग जा स्क्रॅप सूचना टॅबवर क्लिक करा आणि बटण. हे प्रविष्ट करेल
Page
कीवर्ड into स्क्रॅप सूचना आणि एक ड्रॉप डाउन उघडेल. निवडा getTagAttributes
यादीतून. पुढील जोडा 'href'
प्रथम मापदंड म्हणून, हे वेब स्क्रॅपरला href गुणधर्म काढण्यास सांगते, नंतर स्वल्पविराम टाइप करा.
पुढे क्लिक करा हे आपल्याला वेब स्क्रॅपरला सांगण्यास परवानगी देते की कोणत्या घटकांमधून href गुणधर्म मिळवायचे. फिल्टर विंडोमध्ये हे सुनिश्चित करा की 'वेब पृष्ठ' वर प्रकार सेट केला गेला आहे आणि निर्बंध 'टॅग नाव' आणि 'समान' आहेत. मग एंटर करा
a
मजकूर बॉक्समध्ये आणि नंतर जोडा बटणावर क्लिक करा आणि नंतर फिल्टर बटण घाला. ओळीच्या शेवटी अर्ध-कोलन जोडून सूचना समाप्त करा.
आपल्याला खाली दर्शविल्यासारखे काहीतरी सोडले पाहिजे.
Page.getTagAttributes('href', {"tag":{"equals":"a"}});
उपरोक्त कोड वेब पृष्ठावरील सर्व दुवे URL काढेल, परंतु आम्हाला आता हे आवश्यक आहे save त्या दुवा URL च्या. हे करण्यासाठी आपण कमांड वजा अर्धविराम a मध्ये लपेटू Data.save
आज्ञा. हे करण्यासाठी ओळीच्या सुरुवातीस जा आणि निवडा बटण. ड्रॉप डाऊन मध्ये सिलेक्ट करा
save
, नंतर ओळीच्या शेवटी जा आणि स्वल्पविराम जोडा. नंतर आपल्याला 'माझी वेबसाइट' सारख्या डेटासेटला कॉल करण्यासाठी काय जोडायचे ते जोडा, नंतर आणखी एक स्वल्पविराम जोडा आणि नंतर दुवे म्हणून लिंक्स सारखे वर्णन करण्यासाठी आणखी एक पॅरामीटर जोडा आणि नंतर कमांड बंद करून बंद करा. )
अर्धविराम करण्यापूर्वी
आपल्याकडे आता खालील स्क्रॅप सूचना असतील.
Data.save(Page.getTagAttributes('href', {"tag":{"equals":"a"}}), 'My Websites', 'Links');
आता आपण स्क्रॅप चालवत असल्यास आपण वेबसाइटवरील सर्व दुवे काढू शकाल. हे माझ्या वेबसाइट्सच्या नावाने एक दुवे तयार करेल ज्याच्या दुव्याच्या स्तंभ नावाने ती निर्यात केली जाऊ शकतात intएक्स एक्सएमएल, सीएसव्ही किंवा स्प्रेडशीट सारख्या अनेक भिन्न स्वरूपने. स्क्रॅप इंस्ट्रक्शन्स टूलबारमधील विझार्ड बटणाचा वापर करून हे ट्यूटोरियल देखील प्राप्त केले जाऊ शकते.