В заметке рассмотрено использование многопоточного парсера Яндекс ТИЦ на примере обработки списка пользователей ЛиРу (Liveinternet). Для запуска понадобятся: bash (под Windows можно использовать cygwin), perl, wget и, для большего удобства представления результатов, – sort. Все эти утилиты присутствуют практически в любой *nix-ОС или могут быть установлены в cygwin.
Архив метки: тиц
Сравнение производительности сетевых библиотек в Perl
Когда задумал сделать парсер тИЦ для LJ Add/Remove Fiends – решил для начала проверить, какой способ загрузки страниц с показателями тИЦ из скрипта окажется быстрее, поскольку это в любом случае окажется самым узким местом в производительности парсера (любая обработка уже полученных данных, если она сделана без грубых ошибок типа бесконечного цикла, происходит гораздо быстрее загрузки этих данных по сети).
Для начала проверил на локальной машине (первый тест), затем на сервере (второй тест). Воспользовался модулем Benchmark::Timer
, по сути он ставит метки начала и конца, после чего вычисляет разницу между ними (то же самое несложно получить с использованием Time::HiRes
). У Benchmark::Timer
правда есть дополнительная возможность – он может гонять тест до получения результата с заданной обеспеченностью и заданным процентом ошибки.
Третьим тестом, уже из чистого любопытства (поскольку результат был предсказуем) был тест многопоточной загрузки. Естественно этот вариант оказался быстрее любого из однопоточных, в среднем в два раза (при 15 потоках).
Выводы – библиотеки Perl не только выгодней с точки зрения безопасности, но и работают стабильно быстрее вызовов системных утилит. Самую медленную загрузку показал Wget, основывать парсер на нём – явно плохая идея. Многопточность естественно вне конкуренции. Подробности ниже.
Читать далее Сравнение производительности сетевых библиотек в Perl
Обмен ссылками от WestSEO – три ссылки за одну
Принял участие ещё в одной любопытной акции по обмену ссылками. Любопытна она своей “нетрадиционностью” – это не просто линкообмен, подобный тем, что проводятся в ЖЖ.
Алексей Московский предлагает бесплатно разместить написанную вами статью с тремя тематическими в своём блоге WestSEO. Таким образом, мы имеем некий сплав гостевого поста и статьи формата “википедии”, где написавший получит три постоянных тематических ссылки с ресурса ТИЦ 50, а разместивший – качественный контент и ссылку с вашего блога на вашу статью.
Процитирую требования к статьям:
1. Объем от 2000 знаков без пробелов;
2. Интересный, уникальный текст вашего авторства. Давайте обойдемся без рерайта Википедии;
3. Соответствие статьи шаблону и стилю, предложенным ниже;
4. Не более 3-х внешних ссылок на ваши проекты или статьи. С точки зрения естественности, получается идеально если на каждые 1000 символов текста приходиться по одной внешней ссылке.;
5. Внешние ссылки должны быть хотя бы приблизительно тематичными моему блогу или теме статьи. Пластиковых окон и ипотеки не надо, умоляю вас;
6. На эту статью вы должны будете поставить ссылку у себя в блоге (можно постовой, можно использовать в контексте вашего будущего поста — как вам будет удобно). Всего одну ссылку, в обмен на три с моего блога — думаю, это справедливо;
Я уже поучаствовал в акции и написал статью про язык Perl, на котором создаю свои бесплатные SEO-скрипты. Написание заняло у меня всего пол-часа времени, а польза, на мой взгляд, очевидна – три бесплатных тематических ссылки и самосовершенствование в придачу. Так что предлагаю всем своим читателям рассмотреть предложение WestSEO, а возможно – и принять участие в акции.
А для все, кто, как и я, принимает участие в Марафоне молодых блогов, есть приятная новость – участник марафона invite4you предлагает всем марафонцам бесплатный прогон блогов! Спешите воспользваться!
Увеличение Яндекс ТиЦ
На моём блоге выроц ТиЦ. Само по себе событие конечно приятное, но не сверхважное. Однако есть одна особенность – ТиЦ у меня не упорно не желал расти хотя бы до 10 с сентября прошлого года, не смотря на то, что на блог было достаточно много ссылок.
Причину вчерашнго увеличения ТиЦ я вижу в том, что я сгенерировал и разместил на бесплатном хостинге специальную html-страницу, дающую обратные ссылки на сайт, которая и была благополучно проиндексирована яндексом 🙂
Посему смело рекомендую способ получения обратных ссылок через сайты-доноры к применению!
audit – бесплатный скрипт для мониторинга позиций и показателей сайта
Когда-то ко мне (через третьи руки) попал простой, но достаточно удобный бесплатный скрипт, позволяющий следить за показателями и рейтингами указанных сайтов. Он удобен именно для быстрой проверки показателей сайтов (как сделать сайт самому?), которые затем можно детализировать при помощи различных веб-сервисов определения показателей. Автор скрипта мне неизвестен, в самом скрипте я упоминаний авторства не нашел.
Возможности скрипта для отслеживания показателей сайтов
Называется он audit и позволяет отслеживать такие показатели сайта, как:
- Яндекс ТиЦ
- Google PR
- количество страниц в индексе яндекса, google и aport
- ip-адрес указанного домена
- срок окончания регистрации домена
Читать далее audit – бесплатный скрипт для мониторинга позиций и показателей сайта