वेब कॅप्चर आणि रूपांतरित करण्यासाठी साधने

वेब स्क्रॅप दस्तऐवजीकरण

आमच्या स्क्रॅपद्वारे आम्ही उपलब्ध केलेल्या आमच्या विशेष स्क्रॅप सूचना पद्धतींचे हे विहंगावलोकन आहे.

निकष.अप्ली (अ‍ॅरे)

पुरविलेल्या अ‍ॅरेमधून या निकषात पूर्वीच्या ऑपरेशन्सद्वारे काढलेल्या आयटम प्रमाणे त्याच स्थानावरील कोणत्याही वस्तू काढून टाकते.

  • अ‍ॅरे - आवश्यक, त्यामध्ये बदल लागू करण्यासाठी अ‍ॅरे.

निकष.उत्पादित (मूल्ये)

चढत्या क्रमाने मूल्ये मिळवते.

  • मूल्ये - आवश्यक, आपण चढत्या क्रमाने क्रमवारी लावू इच्छित अ‍ॅरे द्या.

मापदंड. (सुया, मूल्य)

निर्दिष्ट मूल्य असलेल्या सुई अ‍ॅरेमधील केवळ आयटम मिळवते.

  • सुया - आवश्यक, फिल्टर करण्यासाठी अ‍ॅरे.
  • मूल्य - आवश्यक, मूल्य आयटम असणे आवश्यक आहे.

मापदंड. तयार (अ‍ॅरे)

नवीन अ‍ॅरेवर ऑपरेशन्स करण्यास तयार नवीन मापदंड तयार करते.

  • अ‍ॅरे - आवश्यक, मध्ये बदल लागू करण्यासाठी स्तंभांचा अ‍ॅरे.

  • निकष.आदिनांतर (मूल्ये)

    उतरत्या क्रमाने मूल्ये मिळवते.

    • मूल्ये - आवश्यक, उतरत्या क्रमाने क्रमवारी लावू इच्छित अ‍ॅरे द्या.

    निकष.एक्वेल्स (सुया, मूल्य)

    केवळ सुईच्या अ‍ॅरेमधील आयटम दर्शविते जे निर्दिष्ट केलेल्या मूल्याइतके असते.

    • सुया - आवश्यक, फिल्टर करण्यासाठी अ‍ॅरे.
    • मूल्य - आवश्यक, मूल्य आयटम समान असणे आवश्यक आहे.

    निकष.एक्सट्रॅक्ट (अ‍ॅरे, पॅटर्न)

    अ‍ॅरे मधील सर्व आयटम मिळविते जे कोणत्याही नमुन्यानुसार ट्रिम केलेल्या कोणत्याही सामन्यांसह.

    • अ‍ॅरे - आवश्यक, अ‍ॅरे मध्ये सामने ट्रिम करण्यासाठी.
    • नमुना - आवश्यक असल्यास, नमुना परत केलेल्या मजकूराच्या इच्छित भागाचे ट्रिम कसे करावे हे परिभाषित करते. ट्रिम करण्याचे मूल्य नमुन्यात}. VALUE} by द्वारे दर्शविले गेले आहे.
      उदाहरणार्थ 'माझे वय 33 आहे' वयापासून वय ट्रिम करण्यासाठी. 'माझे वय {AL VALUE UE}' आहे. वापरले जाईल.

    निकष.greaterThan (सुया, मूल्य)

    सुईच्या अ‍ॅरेमधील एकमेव आयटम दर्शविते जे निर्दिष्ट मूल्यापेक्षा जास्त असतात.

    • सुया - आवश्यक, फिल्टर करण्यासाठी अ‍ॅरे.
    • मूल्य - आवश्यक, मूल्य आयटम त्यापेक्षा मोठे असणे आवश्यक आहे.

    निकष.किप (सुया, गवत)

    गवतच्या अ‍ॅरेमध्ये आढळलेले कोणतेही सामने ठेवून सुया अ‍ॅरे मिळवते.

    • सुया - आवश्यक, फिल्टर करण्यासाठी अ‍ॅरे.
    • गवत - आवश्यक, सुया ठेवण्यासाठी वापरण्यासाठी अ‍ॅरे.

    निकष.विहीन थान (सुया, मूल्य)

    सुईच्या अ‍ॅरेमधील एकमेव वस्तू निर्दिष्‍ट केलेल्या मूल्यापेक्षा कमी मिळवते.

    • सुया - आवश्यक, फिल्टर करण्यासाठी अ‍ॅरे.
    • मूल्य - आवश्यक, मूल्य आयटम त्यापेक्षा कमी असणे आवश्यक आहे.

    निकष.लिमिट (मूल्ये, मर्यादा)

    प्रथम एन मूल्य मिळवते, n मर्यादा बदलणारे होते.

    • मूल्ये - आवश्यक, आपण मर्यादित करू इच्छित अ‍ॅरे पास करा.
    • मर्यादा - आवश्यक, आपण अ‍ॅरेमधून परत येऊ इच्छित मूल्यांची संख्या.

    निकष.नोटक्वेल्स (सुया, मूल्य)

    सुया अ‍ॅरेमधील एकमेव आयटम मिळविते जे निर्दिष्ट केलेल्या मूल्यांच्या समान नसतात.

    • सुया - आवश्यक, फिल्टर करण्यासाठी अ‍ॅरे.
    • मूल्य - आवश्यक, मूल्य आयटम समान नसावेत.

    निकष.मोरेव्ह (सुया, गवत)

    गवतच्या अ‍ॅरेमध्ये आढळलेले कोणतेही सामने काढल्यानंतर सुया अ‍ॅरे मिळवते.

    • सुया - आवश्यक, फिल्टर करण्यासाठी अ‍ॅरे.
    • गवत तयार करणे - आवश्यक, सुया काढण्यासाठी वापरण्यासाठी अ‍ॅरे.

    निकष.रेपीट (अ‍ॅरे)

    अ‍ॅरे मधील आयटम सर्वात लांब कॉलमच्या लांबीशी जुळत नाही तोपर्यंत पुनरावृत्ती करा.

    • अ‍ॅरे - आवश्यक, पुन्हा करण्यासाठी अ‍ॅरे.

    मापदंड. युनीक (सुया)

    सुई अ‍ॅरेमधून केवळ अनन्य मूल्ये मिळवते.

    • सुया - आवश्यक, आपण वरून सर्व डुप्लिकेट मूल्ये हटवू इच्छित अ‍ॅरे द्या.

    डेटा.काउंटफाईल डाऊनलोड ()

    डाउनलोड केलेल्या फायलींची एकूण संख्या मोजा.


    डेटा.लॉग (संदेश)

    स्क्रॅप लॉगवर संदेश लिहितो.

    • संदेश - आवश्यक आहे, लॉग वर लिहिण्यासाठी संदेश.

    डेटा.पॅड (पॅडव्हॅल्यू, डेटासेट)

    विशिष्ट डेटासेटमधील सर्व स्तंभांमध्ये समान संख्येपर्यंत सेलमच्या शेवटी रिक्त सेल जोडून डेटासेटमध्ये सर्व स्तंभ पॅड करते.

    • पॅड व्हॅल्यू - पर्यायी, ज्यासह सेल पॅड करण्यासाठी मूल्य. काहीही निर्दिष्ट न केल्यास रिक्त मूल्य वापरले जाईल.
    • डेटासेट - पर्यायी, पॅड ते डेटासेट

    डेटा.प्रेड कॉलम (डेटासेट, कॉलम)

    निर्दिष्ट डेटासेटमधून निर्दिष्ट स्तंभ स्तंभ वाचतो.

    • डेटासेट - पर्यायी, वरून मूल्य वाचण्यासाठी डेटासेट.
    • स्तंभ - पर्यायी, वरून मूल्य वाचण्यासाठी डेटासेटमधील स्तंभ.

    डेटाsave(मूल्यs, डेटासेट, स्तंभ)

    Saveडेटासेट आणि स्तंभ निर्दिष्ट करण्यासाठी कोणतीही मूल्य किंवा मूल्ये.

    • मूल्य - आवश्यक, आपण इच्छित मूल्यांचे कोणतेही मूल्य किंवा अ‍ॅरे पास करा save.
    • डेटासेट - पर्यायी, डेटासेट करण्यासाठी save किंमत into.
    • स्तंभ - पर्यायी, डेटासेट मधील स्तंभ save किंमत into.

    डेटाsaveडॉकएक्सस्क्रीनशॉट (एचटीएमएलओआरयूआरएल)s, पर्याय, डेटासेट, स्तंभ)

    एचटीएमएल, यूआरएल किंवा यूआरएलचा डीओसीएक्स स्क्रीनशॉट घ्या आणि निर्दिष्ट डेटासेट आणि कॉलममध्ये फायलीचा दुवा वैकल्पिकपणे ठेवतो.

    • url - आवश्यक, आपण DOCX चा स्क्रीनशॉट घेऊ इच्छित url चा कोणताही url किंवा अ‍ॅरे पास करा.
    • पर्याय - पर्यायी, स्क्रीनशॉट पर्याय.
    • डेटासेट - पर्यायी, डेटासेट करण्यासाठी save डीओसीएक्स स्क्रीनशॉट दुवा into.
    • स्तंभ - पर्यायी, डेटासेट मधील स्तंभ save डीओसीएक्स स्क्रीनशॉट दुवा into.

    डेटाsaveइमेजस्क्रिनशॉट (htmlOrUrls, पर्याय, डेटासेट, स्तंभ)

    एचटीएमएल, यूआरएल किंवा यूआरएलचा प्रतिमा स्क्रीनशॉट घ्या आणि निर्दिष्ट डेटासेट आणि कॉलममध्ये फायलीचा दुवा वैकल्पिकपणे ठेवला.

    • url - आवश्यक आहे, url चा कोणताही url किंवा अ‍ॅरे द्या ज्याचा आपण प्रतिमा स्क्रीनशॉट घेऊ इच्छित आहात.
    • पर्याय - पर्यायी, स्क्रीनशॉट पर्याय.
    • डेटासेट - पर्यायी, डेटासेट करण्यासाठी save प्रतिमा स्क्रीनशॉट दुवा into.
    • स्तंभ - पर्यायी, डेटासेट मधील स्तंभ save प्रतिमा स्क्रीनशॉट दुवा into.

    डेटाsaveपीडीएफस्क्रीनशॉट (htmlOrUrls, पर्याय, डेटासेट, स्तंभ)

    एचटीएमएल, यूआरएल किंवा यूआरएलचा एक पीडीएफ स्क्रीनशॉट घ्या आणि निर्दिष्ट डेटासेट आणि कॉलममध्ये फायलीचा दुवा वैकल्पिकरित्या ठेवतो.

    • url - आवश्यक, आपण पीडीएफ स्क्रीनशॉट घेऊ इच्छित कोणत्याही url किंवा अ‍ॅरेला पास करा.
    • पर्याय - पर्यायी, स्क्रीनशॉट पर्याय.
    • डेटासेट - पर्यायी, डेटासेट करण्यासाठी save पीडीएफ स्क्रीनशॉट दुवा into.
    • स्तंभ - पर्यायी, डेटासेट मधील स्तंभ save पीडीएफ स्क्रीनशॉट दुवा into.

    डेटाsaveटेबल स्क्रीनशॉट (htmlOrUrls, पर्याय, डेटासेट, स्तंभ)

    एचटीएमएल, यूआरएल किंवा यूआरएलचा एक टेबल स्क्रीनशॉट घ्या आणि निर्दिष्ट केलेल्या डेटासेट आणि कॉलममध्ये फायलीचा दुवा वैकल्पिकरित्या ठेवतो.

    • url - आवश्यक, आपण टेबलचा स्क्रीनशॉट घेऊ इच्छित url चा कोणताही url किंवा अ‍ॅरे पास करा.
    • पर्याय - पर्यायी, स्क्रीनशॉट पर्याय.
    • डेटासेट - पर्यायी, डेटासेट करण्यासाठी save टेबल स्क्रीनशॉट दुवा into.
    • स्तंभ - पर्यायी, डेटासेट मधील स्तंभ save टेबल स्क्रीनशॉट दुवा into.

    डेटाsaveफाईल (url)s, फाइलनाव, डेटासेट, स्तंभ)

    Saveकोणतीही यूआरएल किंवा यूआरएल फाईल म्हणून वैकल्पिकरित्या निर्दिष्ट केलेल्या डेटासेट आणि कॉलममध्ये फायलीचा दुवा ठेवते.

    • url - आवश्यक, कोणतीही URL किंवा आपण चालू करू इच्छित असलेल्या URL चा अ‍ॅरे पास करा intoa फाइल (ली)
    • फाईलचे नाव - पर्यायी, व्युत्पन्न केलेल्याऐवजी आपण वापरू इच्छित असलेले कोणतेही फाइलनाव द्या.
    • डेटासेट - पर्यायी, डेटासेट save फाइल दुवा into.
    • स्तंभ - पर्यायी, डेटासेट मधील स्तंभ save फाइल दुवा into.

    डेटाsaveToFile (डेटा, फाइलनाव, डेटासेट, स्तंभ)

    Saveकोणताही डेटा किंवा डेटा आयटम एक फाईल म्हणून आणि वैकल्पिकरित्या निर्दिष्ट केलेल्या डेटासेट आणि कॉलममध्ये फायलीचा दुवा ठेवते.

    • डेटा - आवश्यक, कोणताही डेटा किंवा आपण इच्छित डेटा अ‍ॅरे पास करा save फाईल मध्ये
    • फाईलचे नाव - पर्यायी, व्युत्पन्न केलेल्याऐवजी आपण वापरू इच्छित असलेले कोणतेही फाइलनाव द्या.
    • डेटासेट - पर्यायी, डेटासेट save फाइल दुवा into.
    • स्तंभ - पर्यायी, डेटासेट मधील स्तंभ save फाइल दुवा into.

    डेटाsaveअनन्य (मूल्य)s, डेटासेट, स्तंभ)

    Saveडेटासेट आणि स्तंभ निर्दिष्ट करण्यासाठी कोणतेही विशिष्ट मूल्य किंवा मूल्ये. समान डेटासेट आणि स्तंभातील डुप्लिकेट मूल्ये दुर्लक्षित केली आहेत.

    • मूल्य - आवश्यक, आपण इच्छित मूल्यांचे कोणतेही मूल्य किंवा अ‍ॅरे पास करा save.
    • डेटासेट - पर्यायी, डेटासेट करण्यासाठी save किंमत into.
    • स्तंभ - पर्यायी, डेटासेट मधील स्तंभ save किंमत into.

    डेटाsaveयुनिकफाईल (url)s, फाइलनाव, डेटासेट, स्तंभ)

    Saveकोणतीही यूआरएल किंवा यूआरएल एक फाईल म्हणून आणि वैकल्पिकरित्या निर्दिष्ट केलेल्या डेटासेट आणि कॉलममध्ये फायलीचा दुवा ठेवते. ही पद्धत फक्त होईल save डेटासेट आणि स्तंभ निर्दिष्ट करण्यासाठी अद्वितीय मूल्ये किंवा संपूर्ण स्क्रॅपसाठी डेटासेट आणि स्तंभातील अद्वितीय URL नसल्यास.

    • url - आवश्यक, कोणतीही URL किंवा आपण चालू करू इच्छित असलेल्या URL चा अ‍ॅरे पास करा intoa फाइल (ली)
    • फाईलचे नाव - पर्यायी, व्युत्पन्न केलेल्याऐवजी आपण वापरू इच्छित असलेले कोणतेही फाइलनाव द्या.
    • डेटासेट - पर्यायी, डेटासेट करण्यासाठी save फाइल दुवा into.
    • स्तंभ - पर्यायी, डेटासेट मधील स्तंभ save फाइल दुवा into.

    डेटाsaveVideoAnimation (videoUrls, पर्याय, डेटासेट, स्तंभ)

    एक ऑनलाइन व्हिडिओ किंवा व्हिडिओ रूपांतरित करा intएनिमेटेड जीआयएफ (एस), आणि वैकल्पिकरित्या निर्दिष्ट केलेल्या डेटासेट आणि कॉलममध्ये फायलीचा दुवा ठेवते.

    • व्हिडिओ युआरएल - आवश्यक आहे, आपण रूपांतरित करू इच्छित कोणताही व्हिडिओ url किंवा अ‍ॅरे url पास करा intएनिमेटेड जीआयएफ (एस)
    • पर्याय - पर्यायी, अ‍ॅनिमेशन पर्याय.
    • डेटासेट - पर्यायी, डेटासेट करण्यासाठी save अ‍ॅनिमेशन दुवा into.
    • स्तंभ - पर्यायी, डेटासेट मधील स्तंभ save अ‍ॅनिमेशन दुवा into.

    ग्लोबल.गेट (नाव)

    मिळते एक saved चल मूल्य.

    • नाव - आवश्यक आहे, परत करण्यासाठी व्हेरिएबलचे नाव.

    ग्लोबल.सेट (नाव, मूल्य)s, सुरू ठेवा)

    Saveस्क्रॅप केलेल्या पृष्ठांमधील कोणतीही मूल्ये किंवा मूल्ये.

    • नाव - आवश्यक, ते व्हेरिएबलचे नाव save.
    • मूल्य - आवश्यक, करण्यासाठी चल मूल्य save.
    • सुरू ठेवा - पर्यायी, खरे असल्यास व्हेरिएबल स्क्रॅप्स दरम्यान ठेवले जाईल.

    नॅव्हिगेशन.एडडीम्पलेट (urls, टेम्पलेट)

    निर्दिष्ट टेम्पलेटशी संबंधित म्हणून URL किंवा URL परिभाषित करा. हे स्क्रॅप सूचना केवळ काही यूआरएलवर अंमलात आणण्यासाठी प्रतिबंधित करण्यास अनुमती देते.

    • url - आवश्यक, आपण टेम्पलेट परिभाषित करू इच्छित url किंवा url चा कोणताही url पास करा.
    • टेम्पलेट - आवश्यक.

    नेव्हिगेशन. क्लीअर कूकीज ()

    सद्य स्क्रॅपसाठी सर्व कुकीज काढा.


    नेव्हिगेशन.नाविगेट (फिल्टर, टेम्पलेट)

    एक किंवा अधिक HTML घटकांवर क्लिक करा.

    • फिल्टर - आवश्यक आहे, कोणते HTML घटक (र्स) क्लिक करावे ते ओळखण्यासाठी फिल्टर वापरले जाते.
    • टेम्पलेट - निवडलेल्या एचटीएमएल घटकावर नेव्हिगेट करताना नियुक्त केलेले टेम्पलेट.

    नेव्हिगेशन.गोटो (url)

    निर्दिष्ट URL वर त्वरित जा.

    • url - आवश्यक, वर नॅव्हिगेट करण्यासाठी URL.

    नॅव्हिगेशन.ओव्हर (फिल्टर)

    एक किंवा अधिक HTML घटकांवर फिरवा.

    • फिल्टर - आवश्यक, कोणते HTML घटक (हां) वर फिरवायचे हे ओळखण्यासाठी वापरला जाणारा फिल्टर.

    नेव्हिगेशन.आयएस टॅम्पलेट (टेम्पलेट)

    जर वर्तमान पृष्ठ निर्दिष्ट टेम्पलेटचे असेल तर सत्य मिळवते.

    • टेम्पलेट - आवश्यक आहे, पृष्ठ संबंधित आहे का हे तपासण्यासाठी टेम्पलेट.

    नेव्हिगेशन.पॅगिनेट (फिल्टर, सेकंद)

    निर्दिष्ट घटकांद्वारे पेगिनेट्स.

    • फिल्टर - आवश्यक, कोणते HTML घटक (र्स) द्वारे पृष्ठावर घालायचे हे ओळखण्यासाठी वापरला जाणारा फिल्टर.
    • सेकंद - आवश्यक, पृष्ठबद्ध परिणामांवर जाण्या दरम्यान सेकंदांची संख्या.

    नॅव्हिगेशन.मोरेव्ह (फिल्टर)

    एक किंवा अधिक HTML घटक हटवा.

    • फिल्टर - आवश्यक, कोणते HTML घटक (रे) हटवायचे ते ओळखण्यासाठी फिल्टर वापरले जाते.

    नेव्हिगेशन.क्रॉल (फिल्टर)

    निवडलेला घटक किंवा संपूर्ण वेब पृष्ठ स्क्रोल करा.

    • फिल्टर - पर्यायी, कोणता घटक स्क्रोल करायचा हे ओळखण्यासाठी वापरण्यात येणारा फिल्टर, जर पुरवले नाही तर संपूर्ण वेब पृष्ठ स्क्रोल केले जाईल.

    नेव्हिगेशन.सेलेक्ट (मूल्य)s, फिल्टर)

    निवडलेल्या घटकामध्ये एक किंवा अधिक वैध मूल्ये निवडा.

    • मूल्य - आवश्यक, निवडण्यासाठी एक किंवा अधिक मूल्ये.
    • फिल्टर - आवश्यक, कोणते घटक निवडायचे ते ओळखण्यासाठी फिल्टर वापरले जाते.

    नेव्हिगेशन.स्टॉपस्क्रॅपिंग (गर्भपात)

    त्वरित स्क्रॅप करणे थांबवा.

    • गर्भपात - वैकल्पिक, सत्य असल्यास आणखी प्रक्रिया बंद करा आणि कोणतेही परिणाम निर्यात किंवा प्रसारित न केल्यास.

    नेव्हिगेशन.टाइप (मजकूर)s, फिल्टर)

    मजकूर टाइप करा intओए घटक.

    • मजकूर - आवश्यक आहे, टाइप करण्यासाठी मजकूरातील एक किंवा अधिक आयटम.
    • फिल्टर - आवश्यक, कोणते घटक टाइप करायचे ते ओळखण्यासाठी फिल्टर into.

    नेव्हिगेशन.वेट (सेकंद)

    सुरू ठेवण्यापूर्वी बर्‍याच सेकंद प्रतीक्षा करा. हे क्लिक वापरताना कमांड्स निवडा आणि टाइप करा तेव्हा हे सर्वात उपयुक्त ठरते.

    • सेकंद - आवश्यक, प्रतीक्षा सेकंद संख्या.

    पेज कॉन्टॅन्स (शोधा, गुणधर्म, फिल्टर)

    पृष्ठामध्ये शोधण्यासाठी मजकूर असल्यास ते सत्य मिळवते.

    • शोधण्यासाठी आवश्यक मजकूर शोधा.
    • विशेषता - वैकल्पिक, शोधण्यासाठी विशेषता.
    • फिल्टर - पर्यायी, कोणत्या घटकाचा शोध घ्यावा हे ओळखण्यासाठी वापरला जाणारा फिल्टर.

    Page.exists (फिल्टर)

    पृष्ठामध्ये शोध फिल्टरशी जुळणारा घटक असल्यास त्यास सत्य मिळवते.

    • फिल्टर - आवश्यक आहे, फिल्टर शोधण्यासाठी कोणत्या घटकाचा शोध घ्यावा.

    Page.getAuthor ()

    एखादे निर्दिष्ट केले असल्यास पृष्ठ लेखक मिळतो.


    पृष्ठ.गेट वर्णन ()

    एखादे निर्दिष्ट केले असल्यास पृष्ठ वर्णन मिळविते.


    पृष्ठ.getFavIconUrl ()

    पृष्ठाची FavIcon URL मिळवते.


    Page.getHtml ()

    कच्चे पृष्ठ एचटीएमएल मिळवते.


    Page.getKeyवर्ड ()

    पृष्ठाच्या कीवर्डस स्क्रॅप केल्या जातील.


    Page.getLastModified ()

    पृष्ठ मेटाडेटा किंवा प्रतिसाद शीर्षलेखांद्वारे वेबपृष्ठामध्ये अखेरचे सुधारित वेळ मिळाला.


    Page.getPageNumber ()

    स्क्रॅप केल्या जाणार्‍या वर्तमान URL चा पृष्ठ क्रमांक प्राप्त करते.


    पृष्ठ.getPreLiveUrl (अनुक्रमणिका)

    मागील url मिळवते, -1 शेवटची URL दर्शवते, तर कमी संख्या पूर्वीची URL दर्शवते.

    • अनुक्रमणिका - पर्यायी, परत करण्यासाठी मागील पृष्ठाची अनुक्रमणिका. -1 वर डीफॉल्ट.

    Page.getTagAttribute (विशेषता, फिल्टर)

    जुळणारे विशेषता मूल्य मिळवते.

    • विशेषता - आवश्यक, शोधण्यासाठी विशेषता.
    • फिल्टर - पर्यायी, कोणत्या घटकाचा शोध घ्यावा हे ओळखण्यासाठी वापरला जाणारा फिल्टर.

    Page.getTagAttributes (विशेषता, फिल्टर, दुवा साधलेले)

    जुळणारी CSS मूल्ये मिळवते.

    • विशेषता - आवश्यक, शोधण्यासाठी CSS विशेषता.
    • फिल्टर - पर्यायी, कोणत्या घटकाचा शोध घ्यावा हे ओळखण्यासाठी वापरला जाणारा फिल्टर.
    • लिंक्ड टू - वैकल्पिक, ज्यास त्यास जोडले पाहिजे त्या स्तंभानुसार, जेणेकरून संबंधित मूल्ये एकत्र ठेवली जातील.

    Page.getTagCSSAtribute (विशेषता, फिल्टर)

    जुळणारे CSS मूल्य मिळवते.

    • विशेषता - आवश्यक, शोधण्यासाठी CSS विशेषता.
    • फिल्टर - पर्यायी, कोणत्या घटकाचा शोध घ्यावा हे ओळखण्यासाठी वापरला जाणारा फिल्टर.

    Page.getTagCSSAtributes (विशेषता, फिल्टर, दुवा साधलेले)

    जुळणारी विशेषता मूल्ये मिळवते.

    • विशेषता - आवश्यक, शोधण्यासाठी विशेषता.
    • फिल्टर - पर्यायी, कोणत्या घटकाचा शोध घ्यावा हे ओळखण्यासाठी वापरला जाणारा फिल्टर.
    • लिंक्ड टू - वैकल्पिक, ज्यास त्यास जोडले पाहिजे त्या स्तंभानुसार, जेणेकरून संबंधित मूल्ये एकत्र ठेवली जातील.

    Page.getTagValue (फिल्टर)

    जुळणारे घटक मूल्य मिळवते.

    • फिल्टर - पर्यायी, शोधण्यासाठी कोणते घटक शोधायचे ते फिल्टर.

    Page.getTagValues ​​(फिल्टर, दुवा साधलेले)

    जुळणारी घटक मूल्ये मिळवते.

    • फिल्टर - पर्यायी, शोधण्यासाठी कोणते घटक शोधायचे ते फिल्टर.
    • लिंक्ड टू - वैकल्पिक, ज्यास त्यास जोडले पाहिजे त्या स्तंभानुसार, जेणेकरून संबंधित मूल्ये एकत्र ठेवली जातील.

    Page.getText ()

    पृष्ठावरील दृश्यमान मजकूर मिळविते.


    Page.getTitle ()

    पृष्ठाचे शीर्षक मिळवते.


    Page.getUrl ()

    पृष्ठाची URL मिळते.


    पृष्ठ.getValueXPath (xpath)

    पुरवलेले XPATH शी जुळणारे मूल्य मिळवते.

    • xpath - आवश्यक आहे, घटक मूल्य किंवा विशेषता जुळण्यासाठी XPATH.

    पृष्ठ.getValuesXPath (xpath)

    पुरविलेल्या XPATH शी जुळणारी मूल्ये मिळवते.

    • xpath - आवश्यक मूल्य घटक किंवा विशेषता जुळण्यासाठी XPATH.

    पृष्ठ.वैध ()

    सध्या स्क्रॅप केल्या जाणार्‍या URL एक वैध वेब पृष्ठ असल्यास ते सत्य परत करते.


    उपयुक्तता.अरेरे क्लीयन (मूल्यs)

    मूल्ये अ‍ॅरेमधून सर्व शून्य आणि रिक्त मूल्य मिळवते.

    • मूल्ये - आवश्यक, साफ करण्यासाठी कोणत्याही मूल्यांचे अ‍ॅरे पास करा.

    उपयुक्तता.अरे. कॉन्टॅन्स (मूल्यs)

    सुई गवतकाच्या अ‍ॅरेमध्ये असल्यास सत्य मिळवते.

    • सुई - आवश्यक, शोधण्यासाठी कोणतेही मूल्य किंवा मूल्यांचे अ‍ॅरे पास करा.
    • गवत - आवश्यक, सुई किंवा सुया शोधण्यासाठी अ‍ॅरे.

    उपयुक्तता.अरे.डॅमर्वर (अ‍ॅरे एक्सएनयूएमएक्स, अ‍ॅरे एक्सएनयूएमएक्स)

    दोन अ‍ॅरे विलीन करतात intएक दुसर्‍या अ‍ॅरेच्या मूल्यासह रिक्त किंवा शून्य किंमती बदलत आहे. दोन्ही अ‍ॅरे समान आकाराचे असणे आवश्यक आहे.

    • अ‍ॅरेएक्सएनयूएमएक्स - आवश्यक, विलीन करण्यासाठी मूल्यांचा अ‍ॅरे पास करा.
    • अ‍ॅरेएक्सएनयूएमएक्स - आवश्यक, विलीन करण्यासाठी मूल्यांचा अ‍ॅरे पास करा.

    उपयुक्तता.अरे.युनिक (मूल्यs)

    मूल्ये अ‍ॅरेमधून अद्वितीय मूल्य मिळवते.

    • मूल्ये - आवश्यक, अद्वितीय बनविण्यासाठी कोणत्याही मूल्यांचे अ‍ॅरे पास करा.

    युटिलिटी.टेक्स्ट.एक्स्ट्रेक्ट अ‍ॅड्रेस (मजकूर)

    निर्दिष्ट मजकूर मापदंडामध्ये प्रथम ईमेल पत्ता काढतो.

    • मजकूर - आवश्यक, वरून ईमेल पत्ता काढण्यासाठी मजकूर.

    युटिलिटी.टेक्स्ट.एक्स्ट्रेक्ट अ‍ॅड्रेस (मजकूर)

    निर्दिष्ट मजकूर मापदंडावरून सर्व ईमेल पत्ते बाहेर काढते.

    • मजकूर - आवश्यक, वरून सर्व ईमेल पत्ते काढण्यासाठी मजकूर.

    उपयुक्तता.टेक्स्ट.एक्सट्रॅक्ट स्थान (मजकूर, भाषा)

    निर्दिष्ट मजकूर पॅरामीटरमधून प्रथम स्थान स्वयंचलितपणे काढते.

    • मजकूर - आवश्यक आहे, तेथून स्थान काढण्यासाठी मजकूर.
    • भाषा - पर्यायी, आयएसओ एक्सएनयूएमएक्स-एक्सएनयूएमएक्स स्वरूपात दोन अक्षरे काढण्यासाठी मजकूराची भाषा. 'En' वर डीफॉल्ट मजकूर भाषा स्वयंचलितपणे शोधण्याचा प्रयत्न करण्यासाठी 'ऑटो' वापरा.

    युटिलिटी.टेक्स्ट.एक्स्ट्रेक्ट लोकेशन्स (मजकूर, भाषा)

    निर्दिष्ट मजकूर मापदंडामधून आपोआप स्थाने काढतात.

    • मजकूर - आवश्यक, मजकूर वरून स्थाने काढू.
    • भाषा - पर्यायी, आयएसओ एक्सएनयूएमएक्स-एक्सएनयूएमएक्स स्वरूपात दोन अक्षरे काढण्यासाठी मजकूराची भाषा. 'En' वर डीफॉल्ट मजकूर भाषा स्वयंचलितपणे शोधण्याचा प्रयत्न करण्यासाठी 'ऑटो' वापरा.

    युटिलिटी.टेक्स्ट.एक्स्ट्रेक्ट भाषेनाव (मजकूर)

    मजकूर मापदंडावरून निर्दिष्ट केलेली भाषा स्वयंचलितपणे काढते.

    • मजकूर - आवश्यक, मजकूर भाषेमधून काढण्यासाठी.

    युटिलिटी.टेक्स्ट.एक्स्ट्रेक्ट लँग्वेज कोड (मजकूर)

    मजकूर मापदंडावरून निर्दिष्ट केलेली भाषा स्वयंचलितपणे काढते.

    • मजकूर - आवश्यक, मजकूर भाषेमधून काढण्यासाठी.

    युटिलिटी.टेक्स्ट.एक्स्ट्रेक्ट नाव (मजकूर, भाषा)

    निर्दिष्ट मजकूर पॅरामिटरमधून प्रथम नाव स्वयंचलितपणे काढते.

    • मजकूर - आवश्यक, वरून नाव काढण्यासाठी मजकूर.
    • भाषा - पर्यायी, आयएसओ एक्सएनयूएमएक्स-एक्सएनयूएमएक्स स्वरूपात दोन अक्षरे काढण्यासाठी मजकूराची भाषा. 'En' वर डीफॉल्ट मजकूर भाषा स्वयंचलितपणे शोधण्याचा प्रयत्न करण्यासाठी 'ऑटो' वापरा.

    युटिलिटी.टेक्स्ट.एक्स्ट्रेक्ट नावे (मजकूर, भाषा)

    निर्दिष्ट मजकूर मापदंडामधून आपोआप नावे काढते.

    • मजकूर - आवश्यक, वरून नाव काढण्यासाठी मजकूर.
    • भाषा - पर्यायी, आयएसओ एक्सएनयूएमएक्स-एक्सएनयूएमएक्स स्वरूपात दोन अक्षरे काढण्यासाठी मजकूराची भाषा. 'En' वर डीफॉल्ट मजकूर भाषा स्वयंचलितपणे शोधण्याचा प्रयत्न करण्यासाठी 'ऑटो' वापरा.

    युटिलिटी.टेक्स्ट.एक्सट्रक्ट ऑर्गनायझेशन (मजकूर, भाषा)

    निर्दिष्ट मजकूर मापदंडामधून प्रथम संस्था स्वयंचलितपणे काढते.

    • मजकूर - आवश्यक, मजकूर संस्थेमधून काढण्यासाठी.
    • भाषा - पर्यायी, आयएसओ एक्सएनयूएमएक्स-एक्सएनयूएमएक्स स्वरूपात दोन अक्षरे काढण्यासाठी मजकूराची भाषा. 'En' वर डीफॉल्ट मजकूर भाषा स्वयंचलितपणे शोधण्याचा प्रयत्न करण्यासाठी 'ऑटो' वापरा.

    युटिलिटी.टेक्स्ट.एक्स्ट्रेक्ट ऑर्गनायझेशन (मजकूर, भाषा)

    निर्दिष्ट मजकूर मापदंडातून स्वयंचलितपणे संघटना काढतात.

    • मजकूर - आवश्यक, संस्थांकडून काढण्यासाठी मजकूर.
    • भाषा - पर्यायी, आयएसओ एक्सएनयूएमएक्स-एक्सएनयूएमएक्स स्वरूपात दोन अक्षरे काढण्यासाठी मजकूराची भाषा. 'En' वर डीफॉल्ट मजकूर भाषा स्वयंचलितपणे शोधण्याचा प्रयत्न करण्यासाठी 'ऑटो' वापरा.

    युटिलिटी.टेक्स्ट.एक्स्ट्रेक्टसेन्टमेंट (मजकूर)

    निर्दिष्ट मजकूर पॅरामीटरमधून भावना स्वयंचलितपणे काढते.

    • मजकूर आवश्यक - मजकूर पासून भावना काढण्यासाठी.

    युटिलिटी.इमेज.एक्सट्रॅक्ट टेक्स्ट (urls, भाषा)

    कोणत्याही निर्दिष्ट प्रतिमांमधून मजकूर काढण्यासाठी ऑप्टिकल कॅरेक्टर रिकग्निशन वापरण्याचा प्रयत्न.

    • url - आवश्यक, आपण ज्या URL मधून मजकूर काढू इच्छित आहात त्या URL ची URL किंवा अ‍ॅरे पास करा.
    • भाषा - पर्यायी, आयएसओ एक्सएनयूएमएक्स-एक्सएनयूएमएक्स स्वरूपात दोन अक्षरे काढण्यासाठी मजकूराची भाषा. 'En' वर डीफॉल्ट

    उपयुक्तता. URL.addQueryStringमापदंड (url)s, की, मूल्य)

    क्वेरी जोडाstring कोणत्याही URL किंवा URL चे मापदंड.

    • url - आवश्यक, कोणतीही क्वेरी जोडायची असल्यास आपली URL किंवा अ‍ॅरे URL द्या string ते पॅरामीटर
    • की - आवश्यक, जोडण्यासाठी पॅरामीटरची की.
    • मूल्य - आवश्यक, जोडण्यासाठी पॅरामीटरचे मूल्य.

    उपयुक्तता. URL.getQueryStringमापदंड (url)s, की)

    क्वेरीचे मूल्य मिळतेstring कोणत्याही URL किंवा URL मधील पॅरामीटर.

    • url - आवश्यक, आपण क्वेरी वाचण्यास इच्छुक असलेली कोणतीही URL किंवा अ‍ॅरे URL द्याstring पासून पॅरामीटर.
    • की आवश्यक - वाचण्यासाठी पॅरामीटरची की.

    उपयुक्तता. URL.removeQueryStringमापदंड (url)s, की)

    एक क्वेरी काढाstring कोणत्याही URL किंवा URL मधील पॅरामीटर.

    • url - आवश्यक, आपण एखादी क्वेरी काढू इच्छित असलेली कोणतीही URL किंवा अ‍ॅरे URL द्याstring पासून पॅरामीटर.
    • की - आवश्यक, काढण्यासाठी पॅरामीटरची की.

    उपयुक्तता. URL.exists (urls)

    प्रत्येक URL वर कॉल करून URL किंवा URL खरोखर अस्तित्त्वात आहेत का ते तपासा.

    • url - आवश्यक आहे, कोणतीही URL किंवा आपण विद्यमान असलेल्या URL चा URL अरे सादर करा.