Het parseren van gegevens van een website kan in verschillende situaties nodig zijn, bijvoorbeeld om specifieke informatie te analyseren of statistieken van webpagina's te verzamelen. Laten we eens kijken hoe u gegevens effectief kunt parseren met behulp van de SEO Spider-service, aan de hand van een voorbeeld van parseren op basis van categorieën en afbeeldingen.
Om te beginnen klikt u met de rechtermuisknop op de afbeelding en selecteert u 'Code bekijken' in het vervolgkeuzemenu.
Zoek het afbeeldingsadres en kopieer het door "Kopiëren" en vervolgens "Volledig XPath kopiëren" in de vervolgkeuzelijst te selecteren.
Ga nu naar de SEO Spider-service. Selecteer in het bovenste menu “Configuratie”, klik vervolgens in het vervolgkeuzemenu op “Aangepast” en vervolgens op “Extractie”.
In het venster dat verschijnt, klikt u op “Toevoegen” in de rechter benedenhoek.
Voer in de regel linksboven met het label 'Extractor 1' de naam in van de sectie waar gegevens moeten worden verzameld. Je kunt elke naam kiezen.
Selecteer in de vervolgkeuzelijst het XPath-uploadtype.
Plak het gekopieerde XPath-adres in de juiste regel.
In het volgende menu selecteert u "Element extraheren" en klikt u op "OK".
We keren terug naar SEO Spider en selecteren “Modus” - “Lijst” in het menu.
Klik bovenaan het scherm op 'Uploaden' en upload de eerder gekopieerde URL's.
Nadat het parseren is voltooid, gaat u naar het gedeelte 'Overzicht' en zoekt u het gedeelte 'Aangepaste extractie' in de lijst.
Als alles correct is geconfigureerd, ziet u de naam van uw sectie en het aantal verzamelde items. In het hoofdvenster verschijnt een lijst met URL's en adressen van alle afbeeldingen die zijn gevonden met behulp van de opgegeven parameters.
Nu kunt u onnodige tags verwijderen en alleen de lijst met afbeeldingsadressen achterlaten die u nodig heeft.
Een soortgelijk algoritme wordt gebruikt om andere gegevens te parseren, zoals productcategorieën, prijzen, namen en andere kenmerken.
Als u vragen of problemen heeft, kunt u voor elke vraag contact opnemen met de SEO-studio "SEO COMPUTER" via e-mail info@seo.computer.
Identiteitskaart 6261