वेब कॅप्चर आणि रूपांतरित करण्यासाठी साधने

वेबसाइटवरून दुवे काढा

हे उदाहरण देखील उपलब्ध आहे साचा.

वेबसाइटवरून दुवे काढणे हे एक सामान्य कार्य आहे, विशेषत: एचटीएमएल दुवे. सुदैवाने वापरताना हे सोपे आहे GrabzIt चे वेब स्क्रॅपर. सर्वप्रथम स्क्रॅपचे प्रारंभिक पृष्ठ आणि इतर कोणत्याही पर्यायांसारख्या सामान्य तपशीलांसह एक नवीन स्क्रॅप तयार करा.

मग जा स्क्रॅप सूचना टॅबवर क्लिक करा आणि वेब पृष्ठ बटण बटण. हे प्रविष्ट करेल Page कीवर्ड into स्क्रॅप सूचना आणि एक ड्रॉप डाउन उघडेल. निवडा getTagAttributes यादीतून. पुढील जोडा 'href' प्रथम मापदंड म्हणून, हे वेब स्क्रॅपरला href गुणधर्म काढण्यास सांगते, नंतर स्वल्पविराम टाइप करा.

पुढे क्लिक करा फिल्टर बटण हे आपल्याला वेब स्क्रॅपरला सांगण्यास परवानगी देते की कोणत्या घटकांमधून href गुणधर्म मिळवायचे. फिल्टर विंडोमध्ये हे सुनिश्चित करा की 'वेब पृष्ठ' वर प्रकार सेट केला गेला आहे आणि निर्बंध 'टॅग नाव' आणि 'समान' आहेत. मग एंटर करा a मजकूर बॉक्समध्ये आणि नंतर जोडा बटणावर क्लिक करा आणि नंतर फिल्टर बटण घाला. ओळीच्या शेवटी अर्ध-कोलन जोडून सूचना समाप्त करा.

आपल्याला खाली दर्शविल्यासारखे काहीतरी सोडले पाहिजे.

Page.getTagAttributes('href', {"tag":{"equals":"a"}});

उपरोक्त कोड वेब पृष्ठावरील सर्व दुवे URL काढेल, परंतु आम्हाला आता हे आवश्यक आहे save त्या दुवा URL च्या. हे करण्यासाठी आपण कमांड वजा अर्धविराम a मध्ये लपेटू Data.save आज्ञा. हे करण्यासाठी ओळीच्या सुरुवातीस जा आणि निवडा डेटा बटण बटण. ड्रॉप डाऊन मध्ये सिलेक्ट करा save, नंतर ओळीच्या शेवटी जा आणि स्वल्पविराम जोडा. नंतर आपल्याला 'माझी वेबसाइट' सारख्या डेटासेटला कॉल करण्यासाठी काय जोडायचे ते जोडा, नंतर आणखी एक स्वल्पविराम जोडा आणि नंतर दुवे म्हणून लिंक्स सारखे वर्णन करण्यासाठी आणखी एक पॅरामीटर जोडा आणि नंतर कमांड बंद करून बंद करा. ) अर्धविराम करण्यापूर्वी

आपल्याकडे आता खालील स्क्रॅप सूचना असतील.

Data.save(Page.getTagAttributes('href', {"tag":{"equals":"a"}}), 'My Websites', 'Links');

आता आपण स्क्रॅप चालवत असल्यास आपण वेबसाइटवरील सर्व दुवे काढू शकाल. हे माझ्या वेबसाइट्सच्या नावाने एक दुवे तयार करेल ज्याच्या दुव्याच्या स्तंभ नावाने ती निर्यात केली जाऊ शकतात intएक्स एक्सएमएल, सीएसव्ही किंवा स्प्रेडशीट सारख्या अनेक भिन्न स्वरूपने. स्क्रॅप इंस्ट्रक्शन्स टूलबारमधील विझार्ड बटणाचा वापर करून हे ट्यूटोरियल देखील प्राप्त केले जाऊ शकते.