1. Что такое улучшенное определение PageRank (Advanced Check)?
  2. Почему определяется PageRank для сайта, который не доступен?
  3. Как определить PageRank c заданного датацентра Google?
  4. Можно ли использовать как консольное приложение чекер установленный в качестве веб-сервиса?
  5. Почему разные чекеры выдают разные значения PageRank?
  6. Почему чекер выдает разные значения PageRank для одного сайта?
  7. Какие параметры чекера отвечают за надежность определения Alexa/PageRank?

1. Какова производительность чекера?

Чекер способен определять значения PR/Alexa для нескольких тысяч адресов в минуту. В основном скорость определения зависит от заданного количества потоков, загруженности канала сервера и количества заданных датацентров Google (при определении максимального PageRank по нескольким датацентрам). При увеличении количества потоков производительность чекера будет увеличиваться, до тех пор, пока сервер не будет перегружен. Дальнейшее увеличение количества потоков будет снижать производительность. Для достижения максимальной производительности количество потоков должно быть оптимальным и может варьироваться на разных серверах от 20 до 100+.

За счет реализация чекера на С++ он имеет несколько большую производительность и требует меньше ресурсов по сравнению с аналогичными чекерами написанными на PHP и Perl.


2. Как определить PR/Alexa для большого количества адресов?

Используя веб-интерфейс чекера нельзя определить PR/Alexa для большого количества веб-адресов, для этого надо использовать shell или cron.

Запущенные из веб скрипты имеют ограничение по времени выполнения (30 сек). При попытке определить PR/Alexa для большого количества адресов через скрипт веб-интерфейса, сервер может остановить чекер раньше, чем он закончит работу.

Скрипты запушенные из shell или cron, как правило, не ограничены по времени выполнения, поэтому подходят для выполнения данной задачи. При этом чекер вызывается из командной строки с необходимыми параметрами, а веб-адреса задаются в текстовом файле.


3. Почему после запуска чекера ничего не происходит?

Чекер не выводит данные во время проверки. Необходимо дождаться выполнения всего задания, после чекер выдаст все данные сразу, заданным вами способом (в файл или на экран).


4. Как запускать чекер из cron?

Чекер необходимо запускать из того каталога, где он установлен. Для этого перед запуском чекера необходимо назначить текущим (рабочим) каталогом — каталог с чекером. Смена текущего каталога производиться с помощью команды cd (Unix).

Пример. Запускать каждый день в 02 часа 15 минут, определение PageRank для адресов из файла urls.txt, использовать 25 потоков, после определения разложить веб-адреса по файлам (0pr.txt, 1pr.txt.. 10pr.txt) в зависимости от их PageRank.

Командная строка cron: ‘15 2 * * * cd /home/clients/df_ftp0/domains/dfservice.com/html/cgi-bin ; ./chkrpra.cgi check gpr=on indata=file infile=./urls.txt outdata=file outfile=pr.txt sortby=prfile threads=25’.

Где: /home/clients/df_ftp0/domains/dfservice.com/html/cgi-bin — папка с чекером (./chkrpra.cgi).


5. Что такое улучшенное определение PageRank (Advanced Check)?

Существует большое количество сайтов для которых тулбар Google не показывает значение PageRank (при заходе на страницу полоска в тулбаре остается СЕРОЙ). Большинство чекеров при определении PageRank для таких сайтов показывают значение PageRank равное 0, а ведь это не совсем правильно. Когда сайт имеет нулевой PageRank полоска в тулбаре гугла белая, а не серая.

Например, имеется недавно созданная страница: http://some.com/somepage/page.html для которой значение PageRank не определяется тулбаром, при этом на главной странице домена http://some.com/ PageRank равен 4. Присваивать странице http://some.com/somepage/page.html нулевой PageRank, как это делают большинство чекеров, значит уравнять её со сайтами действительно имеющими нулевой PageRank и не представляющими никакой ценности. Чтобы этого избежать и сделан режим улучшенного определения PageRank. Для неопределяемой страницы чекер присваивает прогнозируемое значение PageRank.


6. Почему определяется PageRank для сайта, который не доступен?

Доступность и работа сайта не имеют значения. При определении PageRank все данные берутся от датацентров Google, никаких обращений к сайту у которого определяется PageRank не происходит.


7. Как определить PageRank c заданного датацентра Google?

Для этого необходимо задать датацентр Google в командной строке при вызове чекера (ipgoogle=64.233.179.104). Датацентры можно задавать по IP и по домену.


8. Можно ли использовать как консольное приложение чекер установленный в качестве веб-сервиса?

Можно, при этом переустановка чекера не требуется. Достаточно просто вызывать его из командной строки с соответствующими параметрами, описанными в документации.


9. Почему разные чекеры выдают разные значения PageRank?

Разные чекеры обращаются за данными о значении PageRank к различным датацентрам Google. Значение PageRank у разных датацентров Google может различаться.


10. Почему чекер выдает разные значения PageRank для одного сайта?

Значение PageRank зависит от датацентра Google, к которому обращается чекер. Для определения значения PageRank чекер обращается к нескольким датацентрам, при большой нагрузке на сервер некоторые датацентры Google могут не ответить за отведенное для ответа время и не участвовать в определении PageRank. При двух разных запросах определения PageRank для одного и того же сайта могут принимать участие разные датацентры Google, соответственно значение PageRank тоже могут быть разные.


11. Какие параметры чекера отвечают за надежность определения Alexa/PageRank?

К параметрам, отвечающим за надежность определения значений Alexa/PageRank можно отнести: количество попыток определения (сколько раз чекер будет запрашивать данные у стороннего сервера) и время отводимое на одну попытку определения (время за которое чекер должен получить данные от стороннего сервера).

Количество попыток определения заданы в программе и не настраиваются (PageRank — 2 попытки, Alexa — 3 попытки). Время, отводимое на попытку определения, может задаваться в качестве таймаутов (максимального времени ожидания ответа стороннего сервера). Таймауты по умолчанию: при определении PageRank — 5 секунд, при определении Alexa — 15 секунд. При перегрузке канала сервера, увеличение таймаутов будет способствовать уменьшению количества не определенных значений Alexa и PageRank. В случае если один или несколько из заданных датацентров Google недоступны, то увеличение таймаутов приведет к снижению производительности чекера.