Написать пост

justtoxa

статистика по пробке

лето подошло к концу:( и к этому моменту кадабровчане успели написать в пробке 2770 непустых не повторяющихся комментариев (17.06-30.08).

Обычно наименьшая активность наблюдалась в период с двух часов ночи до одиннадцати утра, видимо за это время они успевают поспать и постоять в настоящих пробках. Кстати ещё не было написано ни одного комментария в период с 6 до 7 утра. Уже с полудня кадабровчане начинают недобросовестно выполнять свою работу и всё чаще посещают сабжевый раздел любимого сайта. А уж когда начальство уходит на обед (с часу до трёх) пробка на кадабре вытягивается нешуточная). В 8-9 вечера значительное число кадабровчан опять встаёт в настоящую пробку, а по приезду домой сразу же бежит общаться в адабравскую пробку. И наконец с нулей до часу все друг другу с пеной у рта рассказывают страшные сказки на ночь.

Статистика по дням недели чётко отражает ситуацию на дорогах в летнее время: в пятницу не протолкнуться, на выходных - свободно.

В качестве бонуса доска флудеров бедолаг вечно торчащих в пробке.
top-10
19 комментариев 1нравится 1избранное
melik
  • razonar
    31 авг 2009 в 03:20
    Ух! А откуда данные?
  • justtoxa
    31 авг 2009 в 03:21
  • marcuss
    31 авг 2009 в 04:11
    Так ты разработчик?) Удивлен)
  • bogatchik
    31 авг 2009 в 08:34
    @marcuss да, признавайся, как ты все высчитал?
  • tmr
    31 авг 2009 в 09:30
    Ха, только вчера подумал распарсить пробку :)
  • bogatchik
    31 авг 2009 в 09:33
    @tmr так это ручной труд?
  • tmr
    31 авг 2009 в 10:12
    @bogatchik Нет конечно, это скрипт на выгрузку пробки и последующий парсинг, учитывая структуры выдачи — довольно простой, скорее всего bash, wget, awk
  • bogatchik
    31 авг 2009 в 11:30
    @tmr м, все джейсон. Кто-то среди нас гений.
    Помню, давно пытался подружить его с flashом
  • justtoxa
    31 авг 2009 в 12:29
    @marcuss нет)
  • justtoxa
    31 авг 2009 в 12:34
    @bogatchik я пытался сделать как tmr говорит, ещё давно у него спрашивал как он распарсил список публикаций. Скачал юникс-утилитс для винды (только один раз в живую трогал убунту), почитал немного про sed, gawk и регулярные выражения и честно говоря не нашёл подходящих команд. Насколько я понял, там надо ещё предварительно очистить от лишнего текста и разбить на поля. Решил поискать просто вин-гуи-прогу:) — безрезультатно. Далее пытался в ворде с помощью «найти и заменить» что-то сделать с исходным кодом страницы — там легче привязаться к классам , … но вот буквально не хватает двух-трёх команд типо «любое количество знаков до пробела» и «часть искомого текста». Вся пробка раскрывается iMacros'ом — получаем html на 1,8mb. Тупо копируем всё вместе с иконками в excel :), далее комбинации функций если(), найти(), пстр().
  • justtoxa
    31 авг 2009 в 12:38
    @tmr я думаю, wget здесь будет излишним
  • tmr
    31 авг 2009 в 15:56
    @justtoxa Ну да, странички тянуть можно и по use LWP::Simple; %)
  • justtoxa
    31 авг 2009 в 16:17
    @tmr я в этом не разбираюсь, но зачем нам тянуть чем-либо странички, если у нас всего одна страница!?
  • tmr
    31 авг 2009 в 16:36
    @justtoxa Как одна? jam/load возвращает только 20 записей, нужно
    $tillid = 0 //счетчик псто
    $url = "http://autokadabra.ru/ajax/jam/load/?tillid="
    $content = ""

    while ($tillid ne 2048) { //на текущий момент
    $content += get($url.$tillid);
    $tillid += 20;
    }

    как-то так
  • tmr
    31 авг 2009 в 16:39
    @tmr ой блин, ошибок сколько
  • justtoxa
    31 авг 2009 в 16:59
    @tmr аа, я думал они накапливаются…
  • tmr
    31 авг 2009 в 21:20
    @justtoxa вот так ^____^
    #! /usr/bin/perl

    use LWP::Simple;

    my $tillid = 20;
    my $url = "http://autokadabra.ru/ajax/jam/load/?tillid=";
    my $content = "";

    open FILE, ">jam.csv" or die $!;
    binmode FILE, ":utf8";
    print FILE "type,id,"."type,text,"."type,user_id,"."type,user_login,"."type,time_created,"."type,time_created_humanized,"."type,user_avatar"."\n";

    while ($tillid <= 2860) {
    $content = get($url.$tillid);
    $content =~ s/\\\\\"\,\"/\"\,\"/g;
    $content =~ s/\\\"/\"\"/g;
    $content =~ s/\"\:\"/\"\,\"/g;
    $content =~ m/\{\"shouts\"\:\[\{(.*)\}\]\,\"messages\"\,\"ok\"\}/;
    foreach (reverse(split(/\}\,\{/, $1))) {
    print FILE "$_\n";
    }
    $tillid += 20;
    }

    close FILE;

  • tmr
    31 авг 2009 в 21:36
  • justtoxa
    31 авг 2009 в 21:59
    @tmr open file or die! забавно:)
Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста, или зарегистрируйтесь.