वेब कॅप्चर आणि रूपांतरित करण्यासाठी साधने
ग्रॅबझिटचा ऑनलाईन समुदाय

नवशिक्या सहाय्याची आवश्यकता आहे (मूळतः चुकीच्या भागात पोस्ट केलेले)

ग्रॅबझिटचे स्क्रीनशॉट साधन कसे वापरावे यावर प्रश्न विचारा.

नमस्कार समाज,

माझ्या अज्ञानाची क्षमा करा. मी एक व्यावसायिक माणूस आहे, तांत्रिक माणूस नाही. मला खात्री आहे की ते माझ्या प्रश्नांमध्ये चमकेल.

वेब स्क्रॅप टूलमध्ये अधिक मजबूत निवड आणि नियंत्रण पॅरामीटर्स वापरणे शक्य आहे, जसे की URL पॅटर्न (सर्वात गंभीर) आणि स्क्रीनशॉट टूलसह फॉलो लाइन्स कंट्रोल सेटिंग्ज. मला फक्त त्या URL वरून बेस URL आणि विस्तारित डोमेन क्रॉल करायचे आहेत आणि क्रॉल किती स्तरांवर जाईल यावर मर्यादा आहेत. माझे उद्दिष्ट फक्त विशिष्ट डोमेन संचावरून बातम्यांचे लेख मिळवणे हा आहे. मी फक्त मजकूर आउटपुट म्हणून घेण्यास प्राधान्य देईन परंतु मी teh docx मध्ये वितरित केलेल्या प्रतिमांसह जगू शकतो. स्क्रीनशॉट टूलचे आउटपुट माझ्या बेस गरजेनुसार माझ्यासाठी उत्तम आहे परंतु निवड आणि नियंत्रण कार्यक्षमता खूप मर्यादित आहे. त्या साधनाचे मानक इनपुट वापरण्यासाठी मला सर्व उपडोमेन आणि लेखांची नावे माहित असणे आवश्यक आहे आणि ते वास्तववादी नाही.

मला वाटले की स्क्रॅपर उत्तम असेल आणि मी ते वापरण्यास सुरुवात केली परंतु नंतर मला त्वरीत कळले की त्या साधनावरील किंमत आणि निर्बंध महत्त्वपूर्ण आहेत! त्या खर्चाच्या रचनेवर आधारित ते वापरणे माझ्यासाठी व्यवहार्य नाही.

लक्षात ठेवा, माझ्याकडे एक कोडर रायटिंग पायथन आहे जो API बरोबर खेळत आहे परंतु तिला या साधनाबद्दल माहिती नाही आणि आमच्या अपेक्षेनुसार एकमेकांशी स्पष्टपणे संवाद साधण्यात आम्हाला आव्हाने येत आहेत, म्हणून मला काळजी वाटते की तिचे कार्य अशा दिशेने जात आहे की माझ्यासाठी इष्टतम नाही. विशेषत:, मी तिला सांगितले की मला वेब स्क्रॅपर सारखीच इनपुट नियंत्रणे हवी आहेत परंतु स्क्रिशॉट टूलसाठी. पण मला वाटत नाही की तिला माझा मुद्दा समजला आहे किंवा त्याचे कौतुक आहे. वेबस्क्रॅप्टरसाठी वेडा उच्च किंमत न देता मजबूत निवड निकषांचा फायदा घेण्यासाठी API वापरणे शक्य आहे का?

कोणत्याही मार्गदर्शनाचे खूप कौतुक होईल.

आगाऊ धन्यवाद!!!
1 फेब्रुवारी 2024 रोजी अज्ञाताने विचारले

1 फेब्रुवारी 2024 रोजी अज्ञाताने विचारले

हाय,

काही हरकत नाही, मी तुमच्या प्रश्नांची उत्तरे देण्याचा सर्वतोपरी प्रयत्न करेन.

सामान्यतः वेब स्क्रॅप एकतर वेबसाइट किंवा URL पॅटर्नपुरते मर्यादित असते, अन्यथा च्या स्वरूपामुळे internet खालील लिंक्समुळे वेब स्क्रॅप कधीही संपणार नाही.

स्क्रीनशॉट टूल एकदा, वेळापत्रकानुसार किंवा वेब पृष्ठे बदलल्यावर निर्दिष्ट URL चे स्क्रीनशॉट घेते. तुमच्याकडे URL ची सूची असल्यास तुम्ही ती कॅप्चर करू इच्छिता ती आयात केली जाऊ शकते into स्क्रीनशॉट टूल.

API सह तुम्ही स्क्रीनशॉट ट्रिगर करण्यासाठी तुमचे स्वतःचे तर्क वापरू शकता. तर तुम्ही जे करत आहात त्यासाठी मला वाटते तुम्हाला काही प्रकारचे सानुकूल वेब स्क्रॅपर आवश्यक असेल, जे API ला ट्रिगर करेल. 

मदत होईल अशी आशा.

1 फेब्रुवारी 2024 रोजी GrabzIt सपोर्टने उत्तर दिले