Как с помощью плагина wp-o-matic спарсить материалы для блога

Как украсть статью за 60 секунд

авто наполнение блогаЭта статья итог изучения темы : Как быстро наполнить контентом блог и потратить на все это 1 час рабочего времени. Как не удивительно, поставленная задача была выполнена. Вот только что завершил свою грязную работу – решил написать статью об проделанной работе, выводы сами сделаете, когда закончите читать этот пост.

Как оказалось все просто, и для работы нужно всего ничего: установленный чистый блог WordPress(работает на локальном сервере), установленный плагин CYRTOLAT или RusToLat (он переводит русские буквы в латинские при формировании ЧПУ адресов страниц блога), плагин WP-o-Matic.

Сразу скажу – не качайте тот, что находиться в депозитарии плагинов WordPress: он устаревший, найдите русскую версию плагина. Админка его на английском, но главное, что плагин wp-o-matic рабочий(я преднамеренно не даю ссылку на скачивание).

Плагин установился вручную корректно, никаких косяков и искажений в тексте получаемых новостей не замечено. А теперь полная инструкция, как украсть статью за 60 секунд от seomans.ru.

  • Установил блог WordPpress отдельно в папку seovor.local. Как вы поняли мой новый блог будет существовать только на компьютере.
  • Установил плагины cyr2lat, all-in-one-seo-pack(плагин не парсит метатеги, при желании прописывайте их вручную)
  • Установил плагин wp-o-matic

Как получить новость с сайта

Так уж получилось, что многие блоггеры транслируют новости c помощью RSS канала: надеяться получить большое количество постоянных читателей. Многие обрезают трансляцию постов с помощью плагина, к примеру Ozh' Better Feed, до тега more, в надежде, что многие зайдут почитать нетленку на блог, а не будут новые заметки читать с помощью Rss-ридера, на чем слегка заработают и накрутят счетчик и поведенческие факторы.

Мне же нужно получить полный текст поста с интересующих меня ресурсов, поэтому пользуюсь услугами сервиса http://fulltextrssfeed.com/.

работаю с rss лентой

Получаю адрес RSS блога(1), с которого я желаю забрать материалы, включаю процесс переделывания короткого поста в полный.

как нстроить получение материалов с rss ленты

Через несколько секунд работы сервис выдает результат, в окне просмотра виден текст постов(3), который транслируется через RSS, затем обрабатывается fulltextrssfeed.com/ , он нужен для организации трансляции статей с помощью плагина wp-o-matic. Для нас RSS адрес изучаемого блога уже иной, он выводиться в окне(4). Выделяю его, копирую, он мне необходим для дальнейшей настройки wp-o-matic.

Сервис помогает получить новость из блога/сайта, который работает на DLE, по умолчанию его новостная ссылке может иметь несколько другой вид: http://домен.ru/rss.xml. Иногда получалось пробить ленты в формате, отличимые от вышеперечисленных.  В нескольких случаях не смог получить новость с помощью это сервиса: долгое время в окне вывода превью(3) отображается крутящееся иконка-колесо, не отображается тест, изображение. Обычно сервис выдает результат меньше, чем за 1 минуту.

Первичная настройка плагина wp-o-matic.

Все что нужно сделать: зайти в администраторский раздел плагина(5), 4 раза кликнуть на кнопку “Next”(6)  завершить настройку, кликнув на кнопку “Submit”(7).

Настройка плагина wp-o-matic

Настройка плагина wp-o-matic.

Пришла очередь автоматического наполнения блога чужими авторскими статьями: я могу настроить получение материалов с нескольких блогов.

Настраиваю первую компанию(8).

 

Настройка плагина wp-o-matic

В вкладке Basic – пропишу название компании, слова латинскими буквами, чтобы знать с какого блога получаю статьи,ведь я буду брать новости сразу с 10 – 20 блогов.

В вкладке feeds (9) вставляю полученный фид с сервиса http://fulltextrssfeed.com/. (4). Если Вам попался неразумный, который в RSS ленту отдает полный текст поста, ему хуже, минуем вышеописанный сервис, адрес RSS вставляем сразу же после получения его с блога жертвы в поле настройки плагина Feed URL (9). Готовимся, что он когда-то поймет ошибку, и станет отдавать нам анонсы.

Categories – прикрепляем полученные посты к созданной рубрике. Так с ними будет легче работать/редактировать/удалять материалы одной тематики, полученные с разных источников.

Rewrite — опции рерайта, проставляются функции замены синонимами. Нужно заполнять, если парсинг статей выполняется с последующей публикацией. Идея в том, чтобы полученные статьи слегка отличались от оригинала.

Вкладка "Options" это настройка опций: снимать ли шаблон, частота проверки фида, использование изображений, вывод даты, имени автора постов и т.п. Можно оставить по умолчанию. Также есть настройка публикации материалов в черновик или в приват или сразу на публикацию. В черновик можно помещать посты для легкого рерайта.

К сожалению, плагин wp-o-matic согласился работать только с настройками по умолчанию.

В верхнем правом углу жму кнопку “Submit”, через полминуты первая компания создана.

Результаты работы плагина wp-o-matic.

Плагин с блога-жертвы забрал 5 новых постов, при этом не возникло проблем с воровством тех статьей, которые размещались в закрытый раздел. Вот в каком виде были получены материалы:

Настройка плагина wp-o-matic

Как видите, в моем распоряжении есть полный текст статьи с названием(10), изображениями(11), вставленными формулами(12). Единственный минус работы с плагином wp-o-matic — пока не понял, как статьи загонять в черновики, не публикуя их на блоге сразу же после получения. Ведь необходимо слегка статьи отредактировать, убрать внутренние ссылки, заменить изображения с водяными знаками аналогом или простым текстовым описанием  в абзац.

Как спарсить новые материалы с помощью плагина wp-o-matic.

Через 3 – 5 дней на блогах seo тематики появятся новые статьи, которые нужно также забрать. Для этого захожу во вкладку “Компании”(13)

Настройка плагина wp-o-matic

Нажму ссылку “обновить”(14), она размещена на против названия каждой созданной компании. Через 10 – 20 секунд у меня новое поступление(15). Захожу в «записи», открываю новые заметки, редактирую их, изучаю и так далее.

Перед установкой этого плагина на блог, который работает в интернете нужно подумать о том, какие материалы и с каких сайтов парсить, так как можно нарваться на злого и умного собственника, который не оставит от вашего ресурса камня на камне. А вот из-за такого способа добычи материалов сайты-новички не могут подняться в выдаче или попадают под АГС. Так как их материалы индексируются после того, как они будут проиндексированы на сайте, который их своровал.

Не имеет смысла публиковать посты с узнаваемых ресурсов – так как их материалы авторские, авторы – известные. К чести некоторых seo-блоггеров, они защитили свои ресурсы, парсинг их блогов не был выполнен мной с помощью плагина wp-o-matic. Но вот новостники, кулинарные блоги отдают статьи в два счета.

Как видите, использование RSS канала для привлечения новых читателей, формирования своей постоянной аудитории читателей представляет угрозу для существования Вашего ресурса. Я легко и непринужденно на протяжении 3 часов собрал бы материал для наполнения ресурсов seo тематики, кулинарии, спорта, новостей и так далее с частотой публикации 4 новости в час.

Вам же предоставляется право выбора. Но это еще не все...

Приветствую Вас, на блоге seomans.ru


Зарегистрируйтесь, чтобы получать рекомендации по созданию блогов и сайтов от seomans.ru

Приветствую Вас на seomans. ru, уважаемый читатель. Предлагаю подписаться на RSS ленту моего блога, Вы также можете следить за развитием моего проекта, читая мой Twitter

Твитнуть

5 комментариев

  1. Ilyich:

    Честное слово, не смог прочитать до конца. Стилистика написания текста такая, что мозг просто выносит. Одна сплошная грамматическая и стилистическая ошибка. Автор, сам не пробовал перечитывать свои посты? Нравится?

    • Игорь:

      Перечитываю по несколько раз.

      Стилистика я не Пушкин, чтобы изобретать легкий слог, я пишу о том, что делаю и это не развлекаловка, иногда трудно разложить полученную информацию по полочкам, стараюсь писать простыми предложениями.

      Стилистическая ошибка — нашел Ваш аккаунт на Меил.ру. X Y 42 года и ни фотографии, ни информации, ни мыслей. Я не могу понять Вас зовут Икс или llyich, Вы иноземец? Прошел по адресу, который Вы вписали в форму комментирования, и Вы после этого мне выдвигаете какие-то претензии??? Ты открой личико, покажи чего сделал, буду рад поучиться. Но понимаю я, ты пришел подгадил и ушел удовлетворенный, а как же миссию выполнил. Только меня не так уж легко вывести из себя. Удачи.

  2. Оксана:

    А что тут не понятного, было Ваше стало наше, и автор инструкцию прилагает, как это реализуется. ТОлько зря он не указал, откуда качать плагин. Игоря иногда заносит с выражением мысли, иногда сложно понять то, что написано. Кто ничего не делает, тот ничего не добивается. Учись писать. Все остальное делаете хорошо

  3. Олег:

    Спасибо за интересную статью Все работает на ура. Очень помогло описание настройки плагина. Буду заходить сюда чаще.

  4. Сергей:

    Не знаю почему, но когда на одном из моих молодых сайтов кто-то ворует контент, у плагиатора у самого потом его собственный блог ломается. Мистика какая-то, не иначе шаманы с бубнами помогают. ;)

Добавить комментарий


+ 9 = двенадать