Moin, ich versuche, die Suchergebnisse der Seite https://web.arbeitsagentur.de/weiterbildungssuche/suche?sw=Personaldienstleistungskaufmann&seite=0&at=liste und der 112 Folgeseiten lokal zu speichern, um sie dann nach weiteren Kriterien zu durchsuchen, die die Homepage nicht ermöglicht. Die Suchergebnisse sollen dann in einer extra Datei gespeichert werden.
Das Auslesen der Suchergebnisse klappt leider weder mit wget, noch mit curl.
Das Ergebnis sieht so aus:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 | <!DOCTYPE html> <html lang="de"> <head><base href="/weiterbildungssuche/"> <title>Weiterbildungssuche - Bundesagentur für Arbeit</title> <meta charset="utf-8"/> <meta name="viewport" content="width=device-width, initial-scale=1.0"/> <meta name="robots" content="follow,index"/> <meta name="commit" content="{{COMMIT}}"/> <meta name="branch" content="{{BRANCH}}"/> <meta name="build-version" content="{{BUILD_VERSION}}"/> <link rel="apple-touch-icon" sizes="180x180" href="assets/favicons/apple-touch-icon.png"/> <link rel="icon" type="image/png" sizes="32x32" href="assets/favicons/favicon-32x32.png"/> <link rel="icon" type="image/png" sizes="16x16" href="assets/favicons/favicon-16x16.png"/> <link rel="manifest" href="assets/favicons/manifest.json"/> <link rel="mask-icon" href="assets/favicons/safari-pinned-tab.svg" color="#5bbad5"/> <link rel="shortcut icon" href="assets/favicons/favicon.ico"/> <link rel="preconnect" href="https://rest.arbeitsagentur.de"/> <meta name="msapplication-config" content="assets/favicons/browserconfig.xml"/> <meta name="theme-color" content="#ffffff"/> <meta name="audience" content="BuergerinnenUndBuerger, Institutionen, Unternehmen"/> <meta name="description" content="Weiterbildungsangebote suchen und finden - bereitgestellt von einer der größten Weiterbildungsdatenbanken Deutschlands."/> <meta name="dcterms.created" content="2020-03-26"/> <meta name="dcterms.modified" content="2020-03-26"/> <meta name="dcterms.publisher" content="Bundesagentur für Arbeit"/> <meta name="keywords" content="Fortbildung, Weiterbildung, Kurs, Seminar, Lehrgang"/> <script type="text/javascript"> window.wbsucheConfig = { backendHost: 'https://rest.arbeitsagentur.de/infosysbub/wbsuche', berufepoolHost: 'https://rest.arbeitsagentur.de/infosysbub/berufepool-rest', entgeltatlasHost: 'https://rest.arbeitsagentur.de/infosysbub/entgeltatlas', geoisGeocodeServer: 'https://geois.arbeitsagentur.de/arcgis/rest/services/BA_Adresslocator/GeocodeServer', geoisStylesheetUrl: 'https://geois.arbeitsagentur.de/arcgis_js_api/library/3.13/3.13compact/esri/css/esri.css', geoisScriptUrl: 'https://geois.arbeitsagentur.de/arcgis_js_api/library/3.13/3.13compact/init.js', geoisImageServer: 'https://geois.arbeitsagentur.de/arcgis/rest/services/WebAtlasDE/ImageServer', ladeanimation: 'true', merklisteActive: 'true', detailNavigationActive: 'true' }; window.infosysbubLibConfig = { oagHost: 'https://rest.arbeitsagentur.de', oamHost: 'https://sso.arbeitsagentur.de', clientId: '38053956-6618-4953-b670-b4ae7a2360b1', clientSecret: 'c385073c-3b97-42a9-b916-08fd8a5d1795', picturePath: ['https://rest.arbeitsagentur.de/sso/baicon.png'], headerFooterBaseUrl: 'https://web.arbeitsagentur.de/headerfooter/hf-v5/releases/v3.x/bahf-webcomponents', piwikUrl: '//web.arbeitsagentur.de/analytics/tracker', piwikId: '1060', logLevel: 'error', feedbackScriptUrl: 'https://web.arbeitsagentur.de/portal/feedback-ui/loader.js' }; window.headerConfig = { BAHeaderHideSuchschlitz: true }; </script> <link rel="stylesheet" href="styles.8e636c52d5632a41.css"></head> <body> <ba-wbsuche-app></ba-wbsuche-app> <script src="runtime.18f0d5b2e02f7191.js" type="module"></script><script src="polyfills.c09e0979894ca647.js" type="module"></script><script src="scripts.e2bf00e150cde77d.js" defer></script><script src="main.c2382895a451bda9.js" type="module"></script></body> </html> |
Beim Auslesen des JAVAscripts bin ich mit meinem Wissen leider raus. Hat jemand eine Lösung?