anonymous@RULINUX.NET~# Last login: 2024-12-24 07:30:49
Регистрация Вход Новости | Разметка | Пользователи | Галерея | Форум | Статьи | Неподтвержденное | Трекер | Правила форума | F.A.Q. | Ссылки | Поиск
[#] [Добавить метку] [Редактировать]
Скрыть

Математик взломал сайт знакомств и нашёл девушку мечты

http://habrahabr.ru/post/210198/

 35-летнему математику Крису Маккинли (Chris McKinlay) из Калифорнийского  университета в Лос-Анджелесе потребовалось всего 88 дней, чтобы  осуществить дата-майнинг анкет на сайте знакомств и подобрать девушку,  которая идеально подходит по характеру. Помог ему в этом доступ к  суперкомпьютерам Калифорнийского университета, пишет Wired.

В июне 2012 года Маккинли работал над докторской диссертацией по обработке больших массивов данных и параллельным методам вычислений. В какой-то момент он решил отвлечься и зарегистрироваться на сайте знакомств OkCupid. Нужно заметить, что этот сайт основан гарвардскими студентами и использует хитрую систему вычисления совместимости между потенциальными партнёрами. Каждый из них отвечает на сотни вопросов о своём характере, привычках и предпочтениях. Вопросы самые разные: "Любите ли вы кошек?" (какие ответы вы приемлете от других), "Как часто вы используете Facebook?", "Как долго планируете встречаться?" и т.д. После этого вы можете посмотреть, насколько тот или иной человек подходит вам. Система показывает вероятность успешных отношений, дружбы и вражды.

Логика в том, что чем больше партнёры похожи, тем лучше им будет друг с другом.

Хитрость в том, что посмотреть, как ответила девушка на определённый вопрос, можно только после того, как вы сами ответите на него. При этом максимальное количество для каждого участника ограничено 350 ответами, в то время как общий банк содержит тысячи вопросов. Другими словами, некоторые ответы девушек навсегда останутся для вас загадкой, а "рейтинг совместимости" может оказаться слегка неточным.

Маккинли нашёл всего лишь около 100 девушек, у которых показатель совместимости превышал 90%, но даже с ними свидания как-то не сложились (Криса хватило на шесть свиданий). И тогда парень придумал способ, как провести анализ по своим собственным правилам.


После фильтрации осталось 5000 девушек, которые живут в Лос-Анджелесе и  Сан-Франциско и заходили на сайт в течение последнего месяца. Крис  написал скрипт на Python для сортировки девушек с разными  характеристиками на семь кластеров, вроде "Заботливые", "Верующие",  "Татуировки" и т.д. 


30 июня компьютерная часть квеста закончилась и наступило время свиданий.  К 20 июля Крис обратил внимание, что женщины из первого кластера часто  живут в дальней части города, а у женщин второй группы часто есть  собачка среднего размера. Для экономии времени он удалил профиль первой  группы и сократил количество кандидаток вдвое. За июль математик смог  провести 55 свиданий. В трёх случаях дело дошло до второго свидания, но  всё безрезультатно, и только на 88-м свидании Крису повезло и он нашёл  поистине родственную душу, 28-летнюю художницу, с которой у него был  рейтинг совместимости 91%. Они продолжили встречаться даже через год,  когда девушка вернулась после годичной стажировки из Катара. Сейчас  собираются пожениться.

Bod(*) (2014-01-25 11:10:31)

Mozilla/5.0 (Windows NT 5.1; rv:26.0) Gecko/20100101 Firefox/26.0

[Ответить на это сообщение]
Этот тред читают 1 пользователь:
Анонимных: 1
Зарегистрированных: 0




(c) 2010-2020 LOR-NG Developers Group
Powered by TimeMachine

Valid HTML 4.01 Transitional Правильный CSS!