Сюда обычно чего-то пишут. Но меня ломает...

Говносайты и жизнь

Раздел про говносайты (ГС)  называется “сателиты”, но мы то с вами знаем, о чем на самом деле идет речь. Некоторые делают вид, что не каждый сателит представляет собой ГС, но это не более чем игра словами.

Я понимаю под ГС сайт, основной целью существования является продвижение других проектов (а не предоставление продукта/услуги конечному пользователю). Продвижение может быть своих проектов, проектов клиентов или проектов других оптимизаторов посредством продажи ссылок (например, тут). При такой постановке вопроса становится понятно, что ГС и сателиты - это одно и то же.

Наличие собственной сетки сателитов позволяет существенно сэкономить на ссылочном бюджете. В частности я  не только использую их для продвижения, но и стараюсь держать их столько, чтобы доход от продажи ссылок в Sape (а где же их еще продавать :) покрывал ссылочные бюджеты белых проектов.

Конечно, ГС можно пачками покупать готовые, но при определенном навыке и наличии свободного времени нетрудно налепить и самому. Главное в этом - выстроенный процесс. Несомненным плюсом выстроенного процесса является то, что при этом не надо думать. Если есть свободное время, не работает голова  и нечего делать, почему бы не слепить очередной унылый говносайт?

Поговорим немного о лучших практиках в этой области.

Движок. ИМХО оптимальнее использовать открытые движки, на которых работает много нормальных сайтов для людей. Вордпресс, джумла, ну и так далее. Что касается вордпресса, мой опыт его использования показывает, что движок крайне хорош для создания ГС и крайне плох для всего остального. Может, я просто не любитель вести болги?

Инсталляция и первоначальная настройка движка - процесс занимающий обычно кучу времени. Я в итоге пришел к тому, что проще всего сделать все настройки один раз, выгрузить дамп базы с чистого установленного и настроенного ГС (mysqldump -uuser -ppwd dbname >shit.sql) и заархивировать файловый уроверь вместе с дампом. В этом случае развертывание нового ГС производится буквально парой команд в шелле (unzip, mysql < ), перед развертыванием дампа надо в нем сделать реплэйс всех старых вхождений доменного имени на новое и после заливки поправить текстовые конфиги.

Дизайн. У меня есть сомнения что дизайн играет хоть какую то роль, но для перестраховки на каждый ГС я вешаю новую тему/шаблон, благо бесплатных в сети навалом. Ну и к тому же так  сайты выглядят более настоящими. Для русских ГС (под sape) дизайн минимально руссифицируется (со временем приходит понимание, что там надо руссифицировать, а что нет, в итоге процесс занимает 10-15 минут), для англоязычных - нет. При желании меняется картинка-логотип.

Контент.  То, что он должен быть уникальным я думаю ни у кого вопросов не возникает. Но это правило действует только для яндекса. Вернее не так. Оно не действует для гугла. В индексе гугла.ком прекрасно живут сайты с дублированным контентом. Поэтому US-сателиты можно спокойно набивать RSS-фидами через wp-o-matic и не заморачиваться вопросами уникальности. Можно долго рассуждать почему так, но мне кажется причина в том, что у гугла ит-инфраструктура строится по немного другим принципам и их система позволяет задешево хранить огромные объемы данных не парясь с дублированным контентом. Все остальные ПС ограничены в объемах хранения (вернее даже больше в возможности обработки этих объемов), поэтому жестоко рубят все дубли в своем кэше.

Это возвращает нас к тому, что русскоязычные сайты должны набиваться уникальным контентом. Я с подозрением отношусть к любой синонимизации, ибо вылеты почти всегда имеют место быть. Лучше всего иметь действительно уникальный контент. Где его взять? Например, тут:

- сканы
- djvu
- закрытые зоны вебсайтов
- вебархив
- переводы (машинные разумеется, на хорошем софте, немного вычищенные ручками. Бессмысленно использовать гугл-транслейт.)

Если у вас возник в голове вопрос про авторское право, он правильно возник. Любой контент кому-то принадлежит. И даже если вы его синонимизировали, это не значит, что он стал внезапно принадлежать вам. Ну, вы поняли, да?

Как подготавливать и заливать? Вопрос интересный, ибо с веб-интерфейса движка долго и геморно. Особенно это касается вордпресса, который страшно тормознутый и неудобный. Код - это поэзия, я все понимаю, но… Есть специализированный софт для подготовки контента для сателитов, и если заниматься ими профессионально и только ими, то это наверно лучше всего. Но если у вас не те объемы чтобы платить за софт, можно подготавливать текст в ноутпаде или водре и заливать его через настольный блогоклиент, например semagic, включив в вордпрессе xml-rpc. Для небольших объемов - самое оно. Как прицепить семагик к вордпрессу можно прочитать например тут. Не забудьте только убрать / перед xmlrpc.php

Ссылки. ГС без ссылочной массы уныл вдвойне. Где ее взять? Опыт показывает, что проще всего купить. Хоть для linkjuice, хоть для тиц. Объем затрат на получение “бесплатных” ссылок оказывается чуть ли не больше, чем на покупку (за полгода например), а при вылете ГС из индекса будет мучительно обидно. Впрочем, о ссылках для ГС я как нибудь напишу отдельно.

Материалы по теме

11 Каментов к статье “Говносайты и жизнь”. Оставьте камент »

  1. Камент от Риана — 2009/11/03 @ 23:26

    Насчет закупки ссылок полностью согласна с автором. Получение естественных ссылок - процес слишком долгий, чтобы использовать его для ГС, который может в любой день вылететь с индекса ((

  2. Камент от 24ds — 2009/11/08 @ 13:42

    - djvu сканируете? а что за закрытые зоны веб сайтов это какие?

  3. Камент от Timp — 2009/11/08 @ 16:07

    djvu конечно же прогоняю через OCR, это ведь растровый формат. Честно говоря, я больше упор делаю на переводной контент.
    Переведенный хорошим переводчиком, с тематическими словарями текст написанный простым языком (видите, сколько условий) получается очень читаемым. И его дальнейшая подготовка занимает не намного больше времени, чем для сканов. Зато гораздо меньше вероятность предъявления претензий в области авторских прав.
    Если речь идет о закрытых зонах, то я имею в виду сайты, распространяющие инфу по подписке. Отраслевые СМИ и порталы кажутся мне наиболее перспективными. Понятно, что большинство ресурсов хотят за подписку денег, но во первых есть триалы, во вторых бесплатные подписки с ограничениями.

  4. Камент от Timp — 2009/11/08 @ 16:12

    Риана, я единственной альтернативой вижу для прокачки ГС спам (хрумер и прочая байда типа спамилки ingeek’a), а также уязвимости CMS-движков. И то и другое я пробовал, и то и другое дает эффект при правильном подходе, причем эффект крайне неплохой. Но тут уже возникают вопросы морально-этических соображений и правовой ответственности за свои действия. Поэтому каждый решает сам.

  5. Камент от Johnny — 2009/11/17 @ 20:12

    Не совсем с вами согласен. Не все сателлиты - говносайты. Есть вполне достойные сателлиты - они дают нормальный контент, имеют небольшую посещалку. Если контент скан, например, и такой сайт находят юзеры через поиск, то значит он им чем-то полезен - что в этом плохого?

  6. Камент от Timp — 2009/11/17 @ 21:44

    Абсолютно ничего плохого не вижу в ГС/сателитах, речь лишь о том, что первична цель создания (влияние на выдачу), а как наше поделие выглядит, имеет ли посещаемость и т.п. это уже второе. Хотя у каждого свое мнение естесснно

  7. Камент от rentgen — 2009/12/13 @ 14:42

    Я не счетаю , что сателлиты - это ГС. Многих знаю с нормальными сателлитами! Может кто-то хочет меня переубедить?

  8. Камент от Timp — 2009/12/13 @ 15:09

    Сателит для людей это уже не сателит. Вопрос не в оформлении, вопрос в назначении.

  9. Камент от Дмитрий — 2010/01/04 @ 17:32

    Много сайтов наполнено переводным контентом. И часть из них уже попало под АГС.
    Из-за контента или нет, пока понять не могу.
    Есть у кого нибудь опыт в этой теме? Как Яндекс реагирует на переводы?
    Если есть опыт, поделитесь пожалуйста)) Очень нужно.

  10. Камент от Timp — 2010/01/10 @ 12:27

    Дмитрий, я думаю пока рано делать выводы по АГС. Что касается статистики вылетов - переводной контент загремел почти весь под АГС (именно АГС-30 а не 17), то же самое со сканами. Не залетели только сайты с очень-очень хорошо чищенным контентом (вычищенные сканы, вычитанные переводы - титаническая работа, сайты в общем то и не ГС даже). Ну и ГС изначально сделанные именно как ГС, привитые от контентного анализа я гляжу тоже живут пока - независимо от типа контента.
    Надо посмотреть как все это будет развиваться в динамике, пока решений готовых и малотрудозатратных ни у кого нет по моему, по крайней мере у меня. Есть наметки, но для их проверки нужно время, а также было бы неплохо чтобы яд наконец устаканил свои алгоритмы. Я почему и не пишу про АГС пока.

  11. Камент от dez — 2010/01/13 @ 19:11

    мде… ГС и их контент оставляет желать лучшего… зря только домены портят(

RSS поток бредоспама. Трэкбэк адрес

Оставьте камент




Политика комментирования:

Как вы можете заметить, тут нет поля "сайт", бесполезно оставлять бессмысленные каменты ради ссылок.
Однако ссылки в теле комментариев, как, например вот эта, приветствуются и открыты для индексации.
Поэтому комментарии проходят ручную модерацию. Адекватные комментарии обычно апрувятся.