Водич за Семалт о продужетку стругача за Цхроме

Да би било који посао опстао и на крају могао расти, потребно је остати испред својих конкурената и различитих ризика. Доношење одлука на основу аналитичких података је сигуран начин да се забораве ови проблеми. Такви подаци могу се добити прикупљањем података. Ту долази лако проширење скрепера за Цхроме: то ће не само олакшати процес прикупљања података, већ ће омогућити и стругање у покрету без компликованих подешавања.

Како се користи Сцрапер

    1. Прво што треба да урадите је да инсталирате додатак, па се пребаците на Цхроме веб продавницу, потражите „скрепер“ и кликните на Адд то Цхроме.

    2. Дођите до веб локације са које намеравате да изгребате податке , означите унос који вас занима додавањем. Кликните десним тастером миша на њу и на менију који искаче изаберите „стругање слично“.

    3. На тај начин покренућете засебан прозор конзоле стругача. Овде ћете видети листу исечених података .

    4. Да бисте сачували садржај, кликните на „сачувај у Гоогле документима“, то ће аутоматски извести податке у Гоогле прорачунску табелу.

Продужено стругање

У случају да планирате да избришете више података, можете користити напредни приступ. Имајте на уму да ће бити много лакше радити с алатом ако имате неко знање о ХТМЛ-у. Претпоставимо да сте желели да избаците податке из извора који има архиву на основу података временске серије. У том случају, ако испробате горе описани метод, добили бисте сакривене податке.

Да бисте решили овај проблем, можете да користите ХТМЛ и КСМЛ језик упита познат као КСПатх. Шта то ради? КСПатх препознаје податке о различитим елементима који се налазе у свакој селекцији. Следеће је упутство како да се то постигне:

1. Идите на конзолу Сцрапер, у горњем левом делу ћете приметити дугме "КСПатх", кликните на њега и наставите да саставите почетну таблицу.

2. Морате написати КСПатх за прави елемент. Тренутни КСПатх који укључује читаве информације биће приказан у формату попут овог "// див [3] / див [3] / див [2] / див". Елементи <див> ће у рачунару ХТМЛ препознати рачунар.

3. Да бисте одвојили препознате податке, морате да користите ступце Сцрапер. Да бисте то учинили, морате потражити различите врсте информација које имате на располагању. У зависности од података које грешате, можете имати наслове. Ови наслови су присутни поред сваког скупа података. Прати их ознака, у овом случају <б> ознака.

4. Помоћу елемента инспекције пронађите и додајте ознаку <б> у свој КСПатх. Сада можете да означите ову прву колону као „насловну колону“, јер ће у њој бити наведени називи. Наставите да креирате различите КСПатхс за сваки ступац који вам је потребан.

5. Кликните на струготину и екстензија ће аутоматски прикупити податке и организирати их у различите ступце које сте поставили.