Како да ползиме голема страница и да извлекуваме податоци користејќи SEO пајак врескачки на жаба

Вреска жаба SEO пајак

Во моментов им помагаме на неколку клиенти Миграции на Маркето. Бидејќи големите компании користат решенија за претпријатија како ова, тоа е како пајакова мрежа што се вплеткува во процеси и платформи со години… до моментот кога компаниите не се ни свесни за секој допир.

Со платформа за автоматизација на маркетинг на претпријатијата како Маркето, формуларите се влезна точка на податоците низ страниците и целните страници. Компаниите честопати имаат илјадници страници и стотици форми низ нивните веб-страници што треба да се идентификуваат за ажурирање.

Одлична алатка за ова е Врескајќи го SEO пајакот на жабата… Можеби најпопуларната платформа на пазарот за ползење, ревизија и извлекување податоци од некоја страница. Платформата е богата со одлики и нуди стотици опции за буквално секоја задача што ви треба.

Врескајќи SEO пајак жаба: ползи и извади

Клучна карактеристика на Screaming Frog SEO Spider е тоа што можете да извршите сопствени извлекувања врз основа на Регекс, XPathили CSSPath специфики. Ова е исклучително корисно бидејќи сакаме да ги разгледаме страниците на клиентот и да ги ревидираме и фатиме вредностите на MunchkinID и FormId од страниците.

Со алатката, отвори Конфигурација> Прилагодено> Извлекување да идентификува елементи што сакате да ги извлечете.

врескајќи жаба обична екстракција

Екранот за екстракција овозможува практично неограничено собирање податоци:

Правила за извлекување пајак оптимизација за жаба

Извлекување на Regex, XPath и CSSPath

За MunchkinID, идентификаторот се наоѓа во скриптата на формата што е во рамките на страницата:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Потоа применуваме а Правило на Регекс за да го фатите ID-то од табулаторот што е вметнат на страницата:

Regex: ["']id["']: *["'](.*?)["']

За ID на образецот, податоците се во ознака за внесување во формата Маркето:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Ние применуваме Правило XPath за снимање на ИД од формата што е вметната во страницата. Пребарувањето XPath бара форма со влез со име на застрашувачки, тогаш екстракцијата заштедува вредност:

XPath: //form/input[@name="formid"]/@value

Врискање Рендер на жаба СЕО-пајак Javascript

Друга одлична опција на Screaming Frog е тоа што не сте ограничени на HTML на страницата, можете да прикажете кој било JavaScript што ќе вметне форми во вашата страница. Во рамките Конфигурација> Пајак, можете да отидете во табулаторот Рендер и да го овозможите ова.

Врискање Рендер на жаба СЕО-пајак Javascript

Се разбира, за ова треба малку подолго време за ползење на страницата, но ќе добиете форми што ги дава JavaScript од страната на клиентот, како и формулари што се вметнати од страната на серверот.

Иако ова е многу специфична апликација, таа е неверојатно корисна бидејќи работите со големи страници. Апсолутно ќе сакате да извршите ревизија каде се вметнати вашите форми низ целата веб-страница.

Преземете вреска жаба SEO пајак

Што мислите?

Оваа страница користи Akismet за намалување на спам. Научете како се обработува вашиот коментар.