четверг, мая 16

Яндекс бдит

Вот такую вот штуку я узнал о себе по адресу http://crypta.yandex.ru/. В связи с этим возникают два вопроса:
Насколько точно эта штука может определить ваш портрет?
Как Старший Брат следит за нами, и нельзя ли как-то это дело отключить?
Начнём с точности. Рубрик, по которым нас считают, всего 11. Из них две — парные, такие, где на две рубрики в сумме должно получиться ровно 100%. Чем больше значение в одной, тем меньше в другой. Например, «Семейный человек» — «Холостяк». Поэтому, будем считать, что всего рубрик 9. Так вот, в моём случае, из 9 рубрик Яндекс дал точный результат в двух, более-менее разумный в ещё двух, и решительно промахнулся в 5. То есть, я конечно, понимаю, что рассматривается не точная принадлежность к какой-то группе, а совпадение интересов с некоей эталонной ЦА, но не об этом сейчас разговор. В целом, я считаю, что точность у Яндекса получилась угрожающе высокая, и время вопить «Аларм! Сетевая приватность опасносте!». Поэтому, для простоты, давайте считать, что я уже завопил, и перейдём ко второму вопросу.
Как нетрудно догадаться, всё это богатство завязано на куках. Сайт yandex.ru выдаёт куку по имени yandexuid, содержащую наш идентификатор — число длинное, как Уроборос. Печенька выдаётся сроком на 10 лет. Достаточно удалить её средствами браузера, и Крипта Яндекса перестанет узнавать вас, обозвав роботом. Не забудьте только, что данные на серверах Яндекса, связанные с этим идентификатором, никуда при этом не денутся.
Впрочем, стоит вам только вновь захотеть чего-то от Яндекса, как он тут же даст вам новую — «печенье всем, даром, и пусть никто не уйдёт обиженным!». Поэтому, удалив куку, стоит побеспокоиться о том, чтобы она не появилась вновь, а для этого в настройках браузера раз навсегда запретить приём куки yandexuid с сайта yandex.ru. Думаю, при этом ничего не должно сломаться — за неимением другого материала для экспериментов, я пробовал с отключёнными куками поиск от Яндекса. Всё работало. Как там Диск или Почта  — не знаю, за неимением и того, и другого. Быть может, там другие куки.
В общем, аккуратнее. И не забывайте про печенье.

12 комментариев:

  1. Сегодня, по-моему, только ленивый об этом не написал. :) Особенно беспокоятся те, кто не пользуются Яндексом. Я лично сомневаюсь, что они могут нормально обрабатывать англоязычные сайты.
    ИМХО это паника на пустом месте, а панику в сети любят. Никто ведь не паникует, глядя на распечатку своих телефонных звонков. А тут эти звонки разнесены по неким рубрикам. Да ради бога.

    ОтветитьУдалить
    Ответы
    1. Я успел раньше Хабра, кажется. :)
      Паника паникой, шутки шутками, а как оно работает, в самом деле, интересно. Например, выяснилось, что история браузера тут ни на что не влияет. Что анализ возможен только при достижении некоего минимального числа посещённых сайтов (что неудивительно), однако при этом корректировка уже имеющегося анализа проводится "на лету", буквально по крупинкам информации. То есть, в тестовом браузере сегодня наутро результат заметно точнее, чем вчера вечером, притом, что я зашёл всего на десяток-другой страниц. :)
      С англоязычными сайтами пока не знаю, надо будет попробовать.

      Удалить
    2. Попробовал анонимно скачать файл с Яндекс Диска без yandexuid - всё работает. Диску нужны куки с narod.ru.

      Удалить
  2. ты просто редко сталкиваешься с компьютерной лингвистикой. :) А эта "точность портрета" мне сильно гороскопы напоминает.

    ОтветитьУдалить
    Ответы
    1. > ты просто редко сталкиваешься с компьютерной лингвистикой. :)

      Вернее будет сказать, что никогда не сталкиваюсь. :)

      > А эта "точность портрета" мне сильно гороскопы напоминает.

      Мне скорее напомнило Акинатора, хотя он угадывает точнее. :)

      Удалить
  3. О, ты тоже этим занялся. :) А я подумывала у себя в блоге написать, но вижу, что уже не оригинально.

    У меня знаешь как? Я в ФФ мужчина и на 98% сова, а также на 60% семейный человек; в хроме тоже мужчина и сова на 93%, а семейный - аж на 69%. А в Опере - женщина и семейный человек на все 84%, а сова - только на 68%. :) Впрочем, в ФФ у меня за три дня степень семейности колебалась, а вот совость остаётся неизменной.

    Ну, а в ие, яндекс-браузер и сафари меня сочли роботом - я ими редко пользуюсь.

    ОтветитьУдалить
  4. > О, ты тоже этим занялся. :)

    У меня сперва было желание покрутить это всё, посмотреть, как оно работает, но как-то запал пропал. :)

    > в ФФ мужчина и на 98% сова, а также на 60% семейный человек; в хроме тоже мужчина и сова на 93%, а семейный - аж на 69%. А в Опере - женщина и семейный человек на все 84%, а сова - только на 68%

    Вашу руку, товарищ сова! :)
    Оно, конечно, в разных браузерах показывает разные вещи, но в твоём случае как-то уж сильно робот обманулся. :) У меня пол, семейное положение и сову безошибочно угадало в обоих браузерах - хотя в Опере менее уверенно, потому что Оперой я пользуюсь заметно реже. :)

    У меня вот такое подозрение (из разряда параноидальных), что в этой крипте можно получить доступ и к чужому профилю (пока, правда, не знаю, зачем это кому-то может быть нужно). Я (в тестовых целях, связанных с восстановлением доступа к собственному профилю, что не противоречит законодательству РФ :D ) получил доступ к диаграмме, не имея яндексовой куки и зная лишь число-ID. Элементарно делается, как оказалось.

    ОтветитьУдалить
  5. Меня больше удивляет, почему в Опере пол женский. По каким таким сайтам я в ней ходила? Мужской - нет, не удивляет. Я по "женским" сайтам не ходюк.

    С совой проще всего - время блуждания по сети учитывается достоверно (в рамках куков, конечно).

    ОтветитьУдалить
    Ответы
    1. > Меня больше удивляет, почему в Опере пол женский. По каким таким сайтам я в ней ходила? Мужской - нет, не удивляет. Я по "женским" сайтам не ходюк.

      Оно, скорее всего, смотрит не только сам сайт, но и по каким страницам на нём ходишь, сколько секунд на что тратится, куда уходишь, и т.д., и т.п., а потом сравнивает с референсной группой.

      > С совой проще всего - время блуждания по сети учитывается достоверно (в рамках куков, конечно).

      На Хабре, кажется, писали, что у крипты какие-то проблемы с учётом часовых поясов.

      Удалить
    2. В Опере у меня, знаешь ли, висят открытыми недочитанные статьи про монгольские и ещё чьи-то осадные технологии. Ну очень характерное женское чтение. :) Ещё я через неё хожу в блог на Я.ру. Ну, и тестирую вёрстку сайтов. Да, тестовый форум в ней же испытывала, но учитывая его новосозданность, вряд ли он что-то сказал бы Яндексу.

      Что касается часовых поясов, то я-то живу по московскому. Полагаю, что оно для Яндекса не слишком экзотично.

      Удалить
    3. > В Опере у меня, знаешь ли, висят открытыми недочитанные статьи про монгольские и ещё чьи-то осадные технологии.

      Например, Храпачевский? :) Кстати, если интересуешься вопросом, его книга "Военная держава Чингисхана" в самом деле очень полезная.

      > Ну очень характерное женское чтение. :)

      А если женщина историк? :)

      Удалить
    4. Да, он. Я, понимаешь, интересуюсь, но не очень усердно - до очередной надобности.

      Историк - это не половая принадлежность. :)

      Удалить