В прошлый раз я описал область применения счетчиков, предъявляемые к ним требования и основные виды отчетов, а также значимость для издателя основных статистических выкладок. В данной статье я намереваюсь рассказать о более сложных статистических расчетах и о методах работы с отчетами. Безусловно, я также коснусь применимости полученных данных и их значения.
Однако прежде чем приступать собственно к отчету, я хочу еще раз сказать несколько слов о выборе счетчика. Почему-то одно из главных требований предъявляемых к счетчику - это его точность. Вот например выдержка из описания к счетчику InfoArt: «В отличие от ряда отечественных и зарубежных механизмов InfoArt HITs обеспечивает высокую надежность и точность "хода"», такие же слова можно встретить в описании счетчиков LinkExchange, Alfa-Counter и пр. На мой же взгляд, высокая точность - это последнее, что нас должно интересовать в счетчике. Судите сами, если сервер, который обсчитывает посещения ваших страниц, не виснет ежеминутно (лучше, если вообще не виснет), а программное обеспечение написано не только руками, но и с головой, то расхождения в цифрах не должны превышать обычной ошибки рассеяния или около 0,5-1 %. Такой ошибкой при обсчете статистических данных вполне можно пренебречь.
В самом деле, учет статистики - это не гонки «Формулы-1» и не скачки с препятствиями, здесь важен более качественный анализ, нежели количественный. Поэтому при выборе счетчика нужно, прежде всего, обращать свое внимание на полноту и качество отчетов, а не на точность показаний этого счетчика. Кроме того, на мой взгляд, большое значение имеет внешний вид счетчика, то, как он впишется в дизайн ваших страниц. С этой точки зрения, новый счетчик от Мафии.ру, явно проигрывает, так как мне трудно представить себе такой дизайн в который он хорошо бы вписался.
Я не хочу сказать, что точность хода счетчика не имеет никакого значения при его выборе, боле того, мне будет крайне интересно посмотреть на результаты, проводимого сейчас Тимофеем Бокаревым исследования самых популярных счетчиков. Я хочу лишь сказать, что точность хода счетчика имеет не более чем второстепенное значение при его выборе.
Итак, вернемся к нашим баранам. Некоторые счетчики предоставляют пользователю значительно более сложные отчеты, чем рассмотренные в предыдущей статье. Это такие данные, как:
- маршрут посетителя по страницам сайта;
- время, проведенное посетителем на сайте вообще и на каждой странице на маршруте;
- полнота загрузки страница в браузер посетителя.
Для счетчиков, которые таких возможностей не предоставляют, нужные данные можно получить подручными способами: сопоставляя другие данные этих счетчиков или данные нескольких одинаковых счетчиков на разных страницах. Есть и другие методы, которые можно получать для получения необходимой статистики. Можно, но неудобно, поэтому, если вы всерьез хотите заняться благоустройством самого сайта, то лучше сразу взять подходящий счетчик. Т.е. (опять же, возвращаясь к выбору счетчика) необходимо четко представлять себе цель, для которой вы собираетесь устанавливать счетчик, так как вполне возможно, что вам будет достаточно рамблеровской статистики.
Возьмем например, нежно любимый мною счетчик ZD-Extreme, он не в состоянии показать вам статистику маршрута посетителя по сайту, но эту неприятность можно довольно легко преодолеть. Для этого расставим счетчики по всем страницам, а затем проанализируем входящий трафик для каждой из внутренних страниц. Конечно, можно отслеживать трафик каждого посетителя по всем счетчика через его IP (причем, если наладить постоянную передачу данных в Mathcad, то это даже и несложно), но гораздо проще построить следующий график, дающий нам точную картину при оперировании большими цифрами.

Подобный график сразу выявляет на сайте все проторенные тропы. Так, хорошо заметны маршруты:
- T-1-2-3-4-out;
- T-1-2-5-out;
- T-6-5-out;
- T-2-3-4-out.
Недостаток этого метода в том, что мы не всегда можем с уверенностью сказать, куда направился посетитель от узловой точки, - точки пересечения двух или более маршрутов. Иногда, зная содержание страниц, мы можем скоррелировать неточности в маршрутах, но, для развлекательных сайтов, это затруднительно.
Другой, весьма изящный, надо сказать, вариант - это баннеры RLE на каждой странице сайта. Недавно в этой баннерообменной сети была включена опция подробной статистике по страницам с баннерами, и теперь вы можете получить вполне приличный отчет с маршрутами посетителей, средним временем их пребывания на сайте и другими данными. К сожалению, последнее время баннеры RLE часто отказываются грузиться, что приводит к значительным искажениям статистических данных (не говоря уже о потере рекламного пространства). Надо сказать, что мне несколько странно, что до RLE (честь им и хвала) никто не додумался этого сделать, так как ход этот достаточно очевиден и очень удобен. Мне выгодно стало поставить баннер RLE на каждой странице сайта. Таким образом, у меня есть нужные мне данные, а у баннерообменной сети больше комиссионных.
Вернемся собственно к статистике: маршруту, времени и полноте загрузки страницы пользователем.
Первым делом, мы можем определить удачные места сайта - это точки схода нескольких маршрутов. Если эти страницы предоставляют самостоятельный интерес, то, вероятно, имеет смысл их несколько доработать, придать им более самостоятельный вид и заслать в службы каталогов и поисковые машины, как независимые страницы. Это даст дополнительный приток посетителей на ваши страницы непосредственно во внутренние разделы, соответственно, не будет обижены и другие части вашего сайта.
Во-вторых, определим среднюю длину маршрута и посмотрим, некоторые из них значительно короче среднего. В том случае, если в нашем распоряжении достаточно большая выборка (10-15 тысяч уникальных посетителей), то эти данные не случайны и их надо тщательно проанализировать. Почему ваши гости заканчивают свой визит именно на этой странице? Что понуждает к этому? Неудачный текст страницы или неудачный ее вид. Очень большая длина страницы (или нескольких страниц на маршруте), так что посетитель просто очень сильно устает и предпочитает найти себе других развлечений. Это может быть также и просто конец темы или очень интересно оформленная ссылка.
В-третьих, нужно попытаться понять, почему средняя длина маршрута такова, какова она есть. Происходит ли это потому, что пользователь проходит предел насыщения, прочитывает целиком весь сайт, или по каким-то другим - менее приятным причинам? Соотнеся эти данные со средним временем нахождения посетителя на сайте, можно также понять, читает ли человек ваш сайт или просто проглядывает его. Очень удачно, если можно соотнести эти данные с полнотой загрузки страницы в браузере пользователя. Очевидно, что, если страница не успевает загрузиться полностью, то пользователь что-то целенаправленно ищет и, не найдя требуемого, уходит.
Кстати, как можно судить о полноте загрузки страницы пользователем? Во-первых, по времени загрузки, во-вторых, потому считались ли последние строчки кода, в-третьих, используя куки, вероятно, также есть какой-нибудь java способ. Пусть эти данные не будут очень точными, но они дадут нам общее представление о предмете. Так что этот пункт не полный бред, как может показаться сначала.
Вернемся к статистике. Представьте, что ваш сайт физически находится на разных серверах с разным временем доступа. Ситуация, согласитесь, нередкая. Тщательно анализируя маршруты посетителей по сайту, можно попробовать перераспределить страницы таким образом, чтобы маршрут целиком лежал на одном сервере. Т.е., фактически, решить обратную «Задачу Коммивояжера». Зачем это делать? На первый взгляд, незачем, но, как говорил один мой знакомый математик: «если можно что-то сократить, то это нужно сократить». Кроме того, будучи расположены на одном сервере, страницы (близкие, естественно, по размеру) будут загружаться более равномерно. Это даст посетителю дополнительное ощущение стиля, а соответственно - комфорта и спокойствия. Эти чувства - немаловажны для издателя.
В следующий раз я намереваюсь рассказать об основных существующих счетчиках, об их достоинствах и недостатках. Приведу сравнительные характеристики и анализ отчетов этих счетчиков.