Vodič Semalt o podaljšanju strgala za Chrome

Da bi lahko vsak posel preživel in na koncu zrasel, je treba ostati pred svojimi konkurenti in različnimi tveganji. Sprejemanje odločitev na podlagi analitičnih podatkov je zanesljiv način, da pozabimo na te težave. Takšne podatke je mogoče pridobiti z zapisovanjem podatkov. Tukaj je enostavna razširitev strgalnika za Chrome: ne bo samo olajšala postopka zbiranja podatkov, ampak tudi omogočila strganje na poti brez zapletenih nastavitev.

Kako uporabljati Scraper

    1. Prva stvar, ki jo morate storiti, je, da namestite razširitev, zato pojdite na spletno trgovino s kromom, poiščite "strgalo" in kliknite dodaj v Chrome.

    2. Pomaknite se do spletnega mesta, s katerega nameravate strgati podatke , in označite vnos, ki vas zanima. Z desno miškino tipko kliknite na meni in v meniju, ki se pojavi, izberite "strgaj podobno".

    3. S tem se bo odprlo ločeno okno konzole strgala. Tukaj boste videli seznam strganih podatkov .

    4. Če želite vsebino shraniti, kliknite »Shrani v Google Dokumente«, ki bo samodejno izvozil podatke v Googlovo preglednico.

Dolgotrajno strganje

Če nameravate izbrisati več podatkov, lahko uporabite napredni pristop. Upoštevajte, da bo delo z orodjem veliko lažje, če boste imeli nekaj znanja o HTML-ju. Recimo, da ste želeli izbrisati podatke iz vira, ki ima arhiv na podlagi podatkov časovnih vrst. V tem primeru, če preizkusite zgoraj opisano metodo, dobite skrite podatke.

Če želite rešiti to težavo, lahko uporabite poizvedbeni jezik HTML in XML, znan kot XPath. Kaj to naredi? XPath prepozna podatke o različnih elementih v vsaki izbiri. V nadaljevanju je navodilo, kako to storiti:

1. Pojdite na konzolo Scraper, v zgornjem levem kotu opazite gumb "XPath", kliknite nanj in nadaljujte s sestavljanjem začetne tabele.

2. Za pravi element morate napisati XPath. Trenutni XPath, ki vključuje vse informacije, bo prikazan v obliki, kot je ta "// div [3] / div [3] / div [2] / div". Elemente <div> bo računalnik prepoznal v dokumentu HTML.

3. Če želite ločiti prepoznane podatke, morate uporabiti stolpce Scraper. Če želite to narediti, morate iskati različne vrste informacij, ki jih imate na voljo. Glede na podatke, ki jih strižete, imate lahko naslove. Ti naslovi so poleg vsakega niza podatkov. Spremlja jih oznaka, v tem primeru oznaka <b>.

4. Z uporabo elementov inšpekcijskega elementa poiščite in dodajte oznako <b> v XPath. Zdaj lahko ta prvi stolpec označite kot "naslovni stolpec", saj bo v njem naveden seznam naslovov. Nadaljujte z ustvarjanjem različnih XPaths za vsak stolpec, ki ga potrebujete.

5. Kliknite na zapisnik in razširitev bo samodejno pobrala podatke in jih razvrstila v različne stolpce, ki ste jih nastavili.