Как слепить говносайт за пару часов
Рано или поздно возникает необходимость слепить кучку самoнаполняемых говносайтов. Причин может быть несколько - это желание срубить трафа на ряде СЧ/НЧ, монетизировавшись контекстом, либо использовать их для ссылочного ранжирования (как своих сайтов, так и для продажи ссылок на биржах).
Wordpress поможет нам в этом. Нужно прикрутить к нему:
- Wp-o-matic для граббинга чужих полных лент на соответствующую тематику (пихаем его в крон, крон на сервере должен быть разрешен. Не надо ставить выполнение тасков целый час, достаточно пяти минут. А то серверу вашему будет не очень хорошо);
- Wp-page-numbers для того, чтобы было побольше страниц и улучшилась внутренняя перелинковка;
- Simple-tags и YARPP для той же цели;
Ну и наконец надо обеспечить уникальность контента.
Варинат 1 - берем яхо-трубу и делаем с ее помощью перевод не-русскоязычных лент. Получается почти нечитаемая, но очень уникальная херня.
Вариант 2 - грабим русские ленты (ну или американские, если сайт туда таргетирован) и прикучиваем к wp-o-matic плагин unikalizator. Для автоматической синонимизации надо в файле wpomatic.php нужно найти функцию insertPost, и заменить строку
‘post_content’ => $content,
на сторку
‘post_content’ => unikalizator_do_action ($content),
Текст получается немного более читаемый, но менее уникальный. Английский текст более читаемый, чем русский, после синонимизации, это связано с особенностями языка.
Уникализатору нужны словари синонимов, мои лежат тут.
С правильными словарями проблема. Во первых, их толком нет. Во вторых, толстые словари загружать не очень хорошо, поскольку работа с ними некисло кушает ресурсы веб-сервера. Но и чем больше словарь, тем менее читаемый получается текст (хотя и более уникальный).
- 6 Каментов »
- 26 Январь 2009, написал Timp