वेब कॅप्चर आणि रूपांतरित करण्यासाठी साधने

डेटासेट पॅड कसा करावा

कधीकधी तेव्हा डेटासेट तयार करणे मध्ये वेब भंगार अधिक मूल्ये जोडली जातात intओ एका स्तंभापेक्षा दुसरा स्तंभ. पहिल्या पृष्ठास स्क्रॅप केल्यानंतर खालील उदाहरणात जॉन हे नाव तीन स्तंभांसह नावात स्तंभात जोडले गेले आहे आणि पुढच्या पृष्ठावर डेव्हिड हे नाव आणखी दोन रंगांसह जोडले गेले आहे. खालील डेटासेट देण्यासाठी

नावरंग
जॉनपिवळा
डेव्हिडलाल
ग्रीन
ब्लू
जांभळा

तथापि ही सारणी दिशाभूल करीत आहे कारण कोणत्या रंगासह कोणते नाव आढळले ते दर्शवित नाही. त्याऐवजी pad सर्व स्तंभ समान लांबी होईपर्यंत डेटासेट स्तंभांच्या शेवटी रिक्त सेल स्वयंचलितपणे जोडण्यासाठी पद्धत वापरली जाऊ शकते. एक उदाहरण pad वापरलेली पद्धत खाली दर्शविली आहे.

Data.save(Page.getTagValue({"class":{"equals":"Name"}}), 'Name', 'Color');
Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color');
Data.pad();

या स्क्रॅप सूचना यासारखे दिसणारे डेटासेट तयार करतात.

नावरंग
जॉनपिवळा
लाल
ग्रीन
डेव्हिडब्लू
जांभळा

आम्ही निर्दिष्ट करुन हे आणखी सुधारू शकू padValue च्या पॅरामीटर pad स्क्रॅपद्वारे सापडलेली नावे असलेली पद्धत. या उदाहरणाप्रमाणेच स्क्रॅपच्या निर्देशांनुसार प्रति पृष्ठ केवळ एकच नाव आहे.

var name = Page.getTagValue({"class":{"equals":"Name"}});
Data.save(name, 'Name', 'Color');
Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color');
Data.pad(name);

जे खाली दर्शविल्याप्रमाणे नाव स्तंभातील प्रत्येक रिक्त सेलमध्ये नाव ठेवते.

नावरंग
जॉनपिवळा
जॉनलाल
जॉनग्रीन
डेव्हिडब्लू
डेव्हिडजांभळा