BIG DATA. Вся технология в одной книге - Андреас Вайгенд
Шрифт:
Интервал:
В реальности некоторые критерии предпочтений выглядят весьма неопределенно. В подавляющем большинстве случаев люди не отказывают в знакомстве тем, кто на несколько месяцев старше, чем их воображаемый идеал. Тем не менее, консультируя несколько сайтов знакомств, я обнаружил, что очень многие склонны указывать свой возраст «некруглой» цифрой в конце какого-то десятка, например двадцать девять, а не тридцать лет[126]. Солгали ли эти люди по поводу своего возраста в момент создания профайла? Или же они скорректировали свои годы по результатам взаимодействия с приложением, выяснив, что «староваты» для пользователей, которые их заинтересовали по результатам поиска? И я задумался о том, как может повлиять на поведение пользователей возможность увидеть историю редактирования.
В ряде случаев мотив уточняющего редактирования понятен и безобиден. Например, после нескольких знакомств человек может решить уточнить раздел своих интересов, поняв, что излишне напирает на свое мастерство скалолаза и не договаривает о том, как ему нравится ходить на концерты. Аналогичным образом он может скорректировать описание объекта поиска. Исправления же более кардинальные, например частые смены статуса с «одинокого» на «состоящего в отношениях», могут вызвать неодобрение.
Вообразим себе сценарий, при котором пользователи получают возможность видеть не только историю редактирования профайла, но и историю общения на сайте. Обычная проблема приложений знакомств для людей традиционной ориентации в том, что женщин часто засыпают сотнями сообщений, в то время как некоторые мужчины вообще не получают их. Чтобы стимулировать более симметричную коммуникацию, в приложениях знакомств попробовали ограничить число сообщений, которые один человек может направить за определенный период времени. Но поскольку аудитория этих приложений ежедневно меняется (пользователи выбывают и прибывают), это верный способ вызвать ее недовольство. А вдруг девушка вашей мечты активирует свой профайл на следующий день после того, как вы исчерпали свой месячный лимит, а к моменту его возобновления снова исчезнет? Вы же не знаете причины, по которым алгоритм не показывает ее вам, – то ли потому, что вы не отреагировали на ее появление сразу, то ли она уже встречается с кем-то еще. Использование механизмов прозрачности, позволяющих выявить честные сигналы в поведении пользователя, – лучший подход по сравнению с навязыванием жестких рамок. Например, в каждом профайле может быть видно, сколько сообщений отправил и получил этот человек за последние сутки, неделю и месяц, а также средние частоту и скорость откликов. Это позволит более обоснованно решать, с кем контактировать.
Подобная информация уже используется в некоторых приложениях знакомств. Приложение знакомств для геев Jack’s предоставляет информацию о частоте откликов на входящие сообщения и описательную статистику (возрастной диапазон, этническая принадлежность, телосложение и т. п.) по людям, которыми действительно интересовался данный пользователь (а не только то, что он описывает в своем профайле в качестве интересующих его черт). Такая прозрачность позволяет пользователям лучше понимать не только имеющиеся варианты, но и свои шансы. Если интересующий вас персонаж отвечает только на 12 процентов сообщений, то, наверное, лучше потратить время на знакомство с кем-то еще, тем более что 64 процента интересующих его пользователей сообщают о своей «накачанности», а это совсем не про вас. Для получения большей достоверности о вкусах пользователей Jack’s опирается не на статистику просмотров или входящих и исходящих сообщений, а исключительно на анализ списка «Избранных», а также специальной функции, позволяющей пользователям выражать свою заинтересованность в знакомстве. Эта опция направляет информацию в базу данных только в случае взаимного интереса.
Самая богатая и более персонализированная по сравнению с этими прямыми сигналами информация, которой обладает любой сайт знакомств, содержится в истории просмотров профайлов каждым пользователем. Однако интерпретировать мотивы этих просмотров достаточно сложно. Работая с сайтом Match.com, я обнаружил пользователя, который заблокировал доступ к себе огромному количеству черных женщин. Скорее всего, это был расист, правильно? Неправильно! Посмотрев на установки его фильтра и его просмотры, мы убедились в том, что все обстоит ровно наоборот: он интересовался именно черными женщинами, причем только теми, кто описывал себя «фигуристыми». Для экономии времени и сил он блокировал пользователей-женщин, попытки познакомиться с которыми оказались неудачными. Информационным детективам приходится решать и такие забавные задачки. А способность обнаруживать интересные случаи и рассказывать о них – важная составляющая умения понимать информацию.
Чтобы правильно трактовать данные, надо встать на точку зрения пользователя. Здесь очень важна обстановка. По ходу дня наши желания меняются, или же это происходит по ходу ночи. Когда я консультировал сингапурский сайт знакомств Fridae, мы заметили, что типы профайлов, просматриваемых в два часа дня пятницы, отличаются от просматриваемых в два часа ночи субботы. В этой связи научной команде Fridae предстояло решить, как использовать эту информацию в рэнкингах, представленных на сайте.
Сайты знакомств все чаще предлагают пользователям возможность раскрыть свою «истинную сущность», стимулируя их добавлять в профайл кнопки ссылок на аккаунты в Facebook, Instagram или Twitter. Но это не значит, что случаи предосудительного поведения пользователей прекратились. Себастиан Боэр, один из специалистов по обработке данных мобильной платформы знакомств Skout, написал алгоритм фильтрации неприемлемых сообщений, под неформальным названием «гадоистребитель»[127]. Что считалось неприемлемым? Это определялось по кликам и взаимодействию пользователей. Если огромное количество пользователей блокировали кого-то определенного, то с большой долей вероятности можно было судить о том, что он – неприятный тип. А тот, кто постоянно слал безответные сообщения конкретному пользователю, явно был неприятен последнему. Со временем алгоритм научился распознавать содержание сообщений, которые обычно остаются без ответа или приводят к блокировке отправителя. Обычно в них присутствовал негатив. Очевидным признаком могли бы служить неприличные выражения, однако определение неприемлемости – значительно более тонкое дело. То, что кажется отвратительным одному человеку, может выглядеть привлекательным для другого. При выявлении закономерностей в блокировках «гадоистребитель» блокировал доставку сообщений. Кроме этого алгоритм пресекал избыточную отправку безответных сообщений какому-то конкретному пользователю. Задачей «гадоистребителя» было поддержание позитивной среды для большинства пользователей.
Поделиться книгой в соц сетях:
Обратите внимание, что комментарий должен быть не короче 20 символов. Покажите уважение к себе и другим пользователям!