वेब कॅप्चर आणि रूपांतरित करण्यासाठी साधने

उत्पादन यादी आणि तपशील पृष्ठे कशी स्क्रॅप करावी

वेबसाइट्सवर बहुतेकदा शोध पृष्ठ असते, त्यामध्ये आयटमची यादी असते, प्रत्येक आयटमवर तपशील पृष्ठाच्या दुव्यासह सारांश वर्णन दिले जाते ज्यात त्या आयटमवर सखोल माहिती असते.

ही रचना बर्‍याचदा वापरली जात असल्याने शोध पृष्ठावरील प्रत्येक वस्तूविषयी आणि तपशील पृष्ठावरील माहिती काढून टाकण्याची आवश्यकता बर्‍याचदा असते. हा लेख अशा प्रकारच्या माहितीला कशाप्रकारे स्क्रॅप करायचा याबद्दल मार्गदर्शन करेल.

प्रथम आपण स्क्रॅप करू इच्छित उत्पादन सूची पृष्ठाची URL प्रविष्ट करा. नंतर आपण उत्पादन सूची पृष्ठावरून निवडण्यास इच्छित माहिती निवडा. डेटाची सर्व उदाहरणे निवडली असल्याचे सुनिश्चित करा.

त्यानंतर स्क्रॅप सूचना पृष्ठावर क्लिक करा स्क्रॅप सूचना जोडा.

सर्वप्रथम लक्षात घेण्याची गोष्ट म्हणजे आमची स्क्रॅपर ब्राउझरच्या अगदी तशाच प्रकारे कार्य करते म्हणून जर एखादी कुकी सुरक्षा सूचना असेल किंवा पृष्ठावर क्लिक करणे थांबविणारी अन्य इनलाइन पॉपअप असेल तर आपल्याला त्यापूर्वी पॉपअप बंद करण्यासाठी स्क्रॅपरला सूचना देणे आवश्यक आहे उर्वरित स्क्रॅप करणे शक्य आहे. यापैकी बहुतेक पॉपअप एकदाच क्लिक करणे आवश्यक आहे आणि जेणेकरुन आपण ते गरबिजआयटीला सांगू शकाल. हे करण्यासाठी घटक क्लिक करा पॉपअप बंद करण्यासाठी आवश्यक असलेल्या एचटीएमएल घटकावर क्लिक करा आणि क्लिक करा. त्यानंतर वन्स ओन्ली ऑप्शनवर क्लिक करा Save आणि पुढे.

पुढे निवडा डेटा काढा कृती, नंतर आपण काढू इच्छित डेटा निवडा. म्हणून, आपण शोध परिणामांच्या सूचीमधून एखाद्या आयटमचे शीर्षक निवडायचे असल्यास. त्या सूचीतील प्रत्येक शीर्षक निवडलेले असल्याची खात्री करा.

आमचा विझार्ड डेटाचे स्वयंचलितपणे ओळखण्याचा प्रयत्न करतो आणि आपोआप आपल्याला पाहिजे त्यापेक्षा अधिक माहिती निवडू शकतो. जर हे घडले तर आपण निवडू इच्छित नसलेल्या आयटमवर पुन्हा क्लिक करा आणि त्या यापुढे समाविष्ट केल्या जाणार नाहीत. हे आपल्या वेब स्क्रॅपरला काय काढू शकते हे शिकवते.

आता आपण काढू इच्छित असलेल्या डेटा आयटमचे गुणधर्म निवडा. जसे की "मजकूर" आणि नंतर पुढे क्लिक करा. पुढील स्क्रीनवर त्यास एक शीर्षक द्या. लक्षात घ्या की आपण डीफॉल्ट टेम्पलेट वापरण्यासाठी सर्व डेटा घेऊ इच्छित आहात. हे असे आहे कारण जेव्हा एखादा विशिष्ट टेम्पलेट नसतो तेव्हा डेटा काढला जाण्याची आपली इच्छा असते.

एकदा आपण सर्व आयटम डेटा निवडल्यानंतर आपण उत्पादन शोध पृष्ठावरून काढू इच्छित आहात. उत्पादन तपशील पृष्ठावरील अधिक माहितीसाठी सर्व दुवे निवडा. हे उदाहरणार्थ प्रतिमा असू शकते. नंतर क्लिक करा घटक क्लिक करा क्रिया टेम्पलेटला "तपशील" वर सेट करा आणि नंतर त्यास पाच सेकंदांचा विलंब द्या आणि पुढील क्लिक करा. आपण नवीन पृष्ठावरून डेटा काढू इच्छित असल्यास हे विचारल्यावर होय निवडा. आता आपण पूर्वी सारखा काढू इच्छित डेटा निवडा. परंतु यावेळी, निर्दिष्ट करा की ते "तपशीलवार" टेम्पलेट अंतर्गत कार्यान्वित केले जाणे आवश्यक आहे.

आणखी एक स्क्रॅप सूचना जोडा आणि मुख्य पृष्ठावर परत जा. यावेळी पृष्ठावरील दुव्यांमधील पुढील बटण निवडा. जेव्हा कृती क्लिक करा पर्याय बॉक्स दिसेल कृपया निवडा पुढील पृष्ठ बटण पर्याय. या मार्गाने स्क्रॅपरला हे माहित आहे की हे बटण प्रत्यक्षात एक पेजिझिनेशन बटण आहे आणि सर्व परिणामांद्वारे पृष्ठबद्ध करेल. कृपया आपल्यास ही भंगार सूचना अंतिम आहे याची खात्री करा. ही शेवटची स्क्रॅप सूचना नसल्यास ती शेवटपर्यंत ड्रॅग केली जाऊ शकते.

त्यानंतर शेड्यूल टॅबवर जा आणि स्क्रॅप सुरू करण्यासाठी तयार करा क्लिक करा. आपण स्क्रॅप व्यवस्थापित करा पृष्ठावरील पंक्ती चिन्ह आणि नंतर स्क्रॅपच्या दर्शक चिन्हावर क्लिक करून रिअल टाइममध्ये स्क्रॅपची प्रगती पाहू शकता.