06:15 25.04.2018
Петербуржцам покажут печатные машинки Майка Науменко и Дмитрия Лихачева
«Колдовские художники» поздравят с 200-летием Карла Маркса
Европейский спутник запустят с космодрома Плесецк на боевой ракете
Европа признала Россию оккупантом Донбасса
В США заявили о провале серийного выпуска Су-57
Врио премьера Армении попросил президента обсудить внеочередные выборы
«Голому стрелку» из США предъявили обвинения в убийстве
Капитан судна «Норд» рассказал подробности задержания украинскими пограничниками
Наехавший на пешеходов в Торонто оставил загадочное сообщение в Facebook
Более 62 тысяч беженцев вернулись в Восточную Гуту
Российские комплексы ПВО сбили беспилотники над авиабазой Хмеймим
В Ереване прошла акция "кастрюля-половник"
"Локо" обыграл "СКА-1946" и завоевал кубок Харламова
Защитника Pussy Riot и Савченко выгнали из адвокатов за матерные твиты
МИД РФ ответил на доклад Госдепа США о нарушениях прав человека в России
Российские дипломаты покинули резиденцию в Сиэтле
В детском саду в Шушарах зарегистрировали вспышку сальмоноллеза
Трамп пообещал продолжить максимальное давление на Северную Корею
Трамп смахнул с Макрона перхоть
Об эвакуации ленинградцев в блокаду расскажет книга «Побратимы»
Петербуржцы снова уличили ретейлеров в выбрасывании хлеба
Экс-глава библиотеки украинской литературы не оправдалась за экстремизм
«Фонтанка» за 60 секунд — 24 апреля
Центробанк признал проблемы с продажей ОСАГО из-за блокировки Telegram
«Галерею» эвакуировали из-за проблем с электричеством
Участница нападения на школьный автобус в Петербурге приговорена к реальному сроку
Рубль укрепился к доллару и евро
«Аэрофлот» продлевает рабочий день ради блокадников
Уголовное дело против Мединского просит возбудить Центр Рерихов
На выходных по Петербургу будут ездить ночные автобусы
Смольный отказал штабу Навального в шествии «Он вам не царь» по Загородному проспекту
В Совете Федерации выступили против запрета на ввоз лекарств из США
Viber с трудом восстанавливается после блокировки Telegram
Комтранс рассказал, как пережить субботу без «Приморской»
Израиль пообещал уничтожать ЗРК С-300 в Сирии, если они будут угрожать его авиации
Город раздал контракты на дорожную разметку почти на полмиллиарда
Антикризисный управляющий задержан в Петербурге при получении 22 млн рублей
Сенатор Лисовский порекомендовал заменить импортные лекарства на «аскорбинку и марганцовочку»
Новая Голландия летом откроет песочный пляж с шезлонгами
Петербург обеспечат радиосвязью во время мундиаля за 20 млн рублей
В ОЗХО подтвердили, что главу организации разыграл российский пранкер
СМИ анонсировали уход Шувалова из правительства в МГУ
Финны разработали приложение для распознавания настроения по лицу
ГЛОНАСС перешел на самоокупаемость
Пассажиропоток между Россией и Хельсинки за год вырос на треть
Росавиация: Полеты над Афганистаном, Ливией, Мали и Сомали небезопасны
Хайпанувший на «Зимней вишне» пранкер стал спикером «Миротворца»
В Сестрорецке водителей просят не давить серых жаб, а помочь им перейти дорогу
«Связной» в Пушкине покорили небрежные налётчики
Лидер «Кровостока» в гостях у Дудя вспомнил признаки СССР
За помощь новгородскому авторитету петербургский правозащитник получил условный срок
Депутат-яблочник поспорил с ВМФ и заявил, что реконструкция Адмиралтейства невозможна по закону
Прожиточный минимум в Петербурге за I квартал вырос на 70 рублей
Госдума собирается разрешить курилки в аэропортах
В Mail.ru заявили, что не будут помогать в блокировке Telegram
Дмитрий Шагин разрисовал гигантского кота Ахилла к чемпионату мира по футболу
Выживших в тренинге для будущих губернаторов наградили грамотами
В Смольном считают, что бывшее здание Европейского университета «опасно для жизни»
«Русь Сидящая» презентует в Петербурге клинику юридической помощи
Роскомнадзор заблокировал шрифты Google
«Фонтанка» оплатила долги Дурова
Невзоров: Меня, как главного атеиста страны, не оскорбляет «Еретичка»
Фонд Дерипаски отменил из-за санкций книжный фестиваль в Иркутске
Правозащитники из 13 стран попросили крупнейшие IT-компании защитить Telegram от российских властей
В «Газпроме» сравнили поставки газа и пива, европейцы заявили, что «без пива прожить можно, а без газа — нет»
Общество

Матрице известно все. Даже то, что Трамп - холостяк

Студенты и сотрудники Университета ИТМО создали алгоритм, определяющий семейное положение пользователей c точностью до 86%. Как еще умеют использовать Big Data в России - изучала «Фонтанка».
Матрице известно все. Даже то, что Трамп - холостяк
фото с сайта twitter.com

Ни один шаг в соцcетях не ускользает от тех, кто умеет управлять большими данными. Специалисты технологий обработки больших массивов данных и их взаимосвязей (Big Data) могут узнать и семейное положение, и предпочтения в еде, и политические активности. Все эти сведения в ежедневных терабайтах «потребляют» бизнесмены, предлагая пиццу нужного вкуса или новости о нравящемся кандидате в президенты. И пока эксперты ещё определяются с тем, что можно, а что нельзя относить к термину Big Data и стоит ли нам бояться «всевидящего ока», профилирование пользователей соцсетей уже вдохновляет сотни стартаперов и студентов, оттачивающих мастерство дата-аналитики. 

Например, студенты и сотрудники Университета ИТМО совместно с Национальным университетом Сингапура создали алгоритм, определяющий семейное положение пользователей c точностью до 86%, используя данные трех соцсетей. Исследователи объединили данные из Twitter, Instagram и Foursquare и утверждают, что параметр «семейности» угадывается с точностью до 86%, что на 17% точнее, чем по одной из соцсетей.

«Мы определяем не юридический статус человека, а занято его сердце или нет, – рассказал в эфире интернет-канала [Фонтанка.Офис] математик ИТМО Андрей Фильченков, один из разработчиков алгоритма. – Пока мы используем аккаунты на английском языке. Но факт остается фактом: если человек захочет проверить, есть ли кто-то у его девушки, то он сможет это сделать».

Андрей Фильченков попытался в прямом эфире проанализировать твиттер Дональда Трампа. Рабочий алгоритм использует для анализа средний размер твитта, наиболее частые объекты на фото, распределение чекинов и так далее. Проанализировав твитты Трампа, Андрей Фильченков пришел к выводу, что он… холост. «У него за месяц написаны десятки сообщений, – прокомментировал математик. – Хотя тут  мы отчасти определяем, и женат ли Трамп, и женаты или замужем его помощники, ведущие Твиттер».


В анализе открытых данных всегда есть один нюанс: если человек врет, то матрица бессильна. Например, известный факт, что мужчины чаще указывают в статусе, что они не в браке, а на самом деле все ровно наоборот. Кроме того, соцсети неохотно расстаются с любой информацией, даже открытой, если ее можно продать. 

«Соцсети очень чувствительны к тому, что данные используются без согласования с пользователями, – пояснил Андрей Фильченков. – Поэтому для нашего эксперимента данные собираются вручную, хотя могу легко написать алгоритм, чтобы автоматически скачивать информацию из того же Твиттера».

К данным пользователей трепетно относятся и российские соцсети. Например, «ВКонтакте» в конце января подала иск в Арбитражный суд Москвы к Double Data и Национальному бюро кредитных историй. По данным ряда СМИ, соцсеть требует прекратить использование данных пользователей для оценки их кредитоспособности.

Вопрос регулирования Big Data уже поднимается и на государственном уровне. Не далее чем в конце прошлого года Роскомнадзор заявлял о необходимости законодательного ограничения в вопросах идентификации человека в соцсетях и прогнозирования его поведения. Пока дело ограничилось рабочей группой под предводительством советника президента по Интернету Германа Клименко. На базе Координационного центра национального домена сети Интернет представители Минкомсвязи и игроки телеком-рынка будут пытаться понять, по каким параметрам Big Data можно зарегулировать.

Тем не менее, как считает соавтор алгоритма предсказания семейного положения Ксения Бурая, которую цитирует ИТМО, профилирование пользователей могут использовать, например, рекрутеры, чтобы узнать больше о людях, которые устраиваются на работу. 

«Если говорить глобально, характеристика личности по активности в соцсетях позволит вычислять членов опасных группировок, а также находить людей, склонных к депрессии или самоубийству, и предлагать им своевременную помощь», – поясняет Ксения Бурая, которая в эти дни представляет разработку в Сан-Франциско, на тематической научной конференции.

«Если не говорить о проектах, которые используют спецслужбы – Палантир в США, например, то мониторинг социальных сетей – самый распространенный из инструментов по работе с большими данными, – говорит и  основатель сервиса для аналитики и продвижения в мессенджерах Комбот Федор Скуратов. – Практически любой современный IT-проект работает с Big Data. А у термина, строго говоря, даже нет количественного обозначения. Что такое Big Data? 1 мегабайт, 100, терабайт? Количество записей в базе? В общем, коммерческим является все, что участвует в цепочке работы с данными, от баз до особо мощных видеокарт, заточенных под работу анализирующих эти данные нейросетей. Среди известных простому пользователю проектов – FindFace. А так... мы все сталкиваемся с Big Data каждый день, заходя в «Фейсбук».

Коммерческий директор Bell Integrator Александр Молодцов привел еще один пример широкого применения Big Data потребителями – сравнение ценовых предложений. «Такие сервисы, как «Яндекс.Маркет» и booking, базируются на Интернете, сайты знакомств, позволяющие осуществлять поиск по ряду параметров (возраст, образование, интересы), – тоже пример использования данной технологии».

Чисто коммерческие проекты, такие как интернет-таргетинг, быстрее адаптируются и находят свою нишу и своих клиентов. В решении остросоциальных вопросов Big Data пока мало помогает. Например, определить местоположение человека, попавшего в беду и не выходящего на связь с родственниками, технически можно в считанные секунды. Однако законодательная база не предусматривает такого быстрого взаимодействия.

«Загвоздка в методах преподнесения этой информации, – уверен доцент кафедры интеллектуальных технологий в гуманитарной сфере ИТМО Андрей Куркин. – На Западе такая работа активно используется, в логистике например. В России это только зарождается. Сейчас, конечно, анализируют визуальные образы – распознание лица. Например, это система видеонаблюдения в аэропорту, когда путем поведенческого анализа можно определить, что пассажир ведет себя нестандартно. Это для студентов практические и дипломные работы. Государство такой заказ пока не формирует. Потом эти студенты идут работать в разные компании, в «Сбертех», «Яндекс», Гугл.

По данным генерального директора "ТМТ Консалтинг" Константина Анкилова, в России рынок Big Data занимает менее 1% от глобального. По итогам 2016 года он составил около 22 млрд руб. По оценкам эксперта, объем мирового рынка Big Data приближается к $ 40 млрд. По словам Константина Анкилова, сегодня даже в мире 60% рынка Big Data занимают поставщики оборудования и софта и только 40% приходятся, собственно, на пользовательский сервис.

«Сегодня в России основным потребителем данной технологии являются банки, – уточняет Александр Молодцов. – Банки используют Big Data с точки зрения двух основных направлений: анализ поведения клиента и предоставление клиентам различных срезов информации». Так, например, в конце 2016 года Сбербанк запустил проект «Открытые данные» – продукт на основе технологии Big Data. Проект призван предоставлять информацию, касающуюся финансовой активности клиентов. Любой человек может зайти на сайт и узнать о средних суммах на кредиты, оценить количество заявок, сравнить динамику зарплат в разных регионах.

Меж тем светлое будущее в плане динамики развития у Big Data, несомненно, есть. «У нас есть студенты действительно интересующиеся, с большим багажом. Это заметно. Они хотят понимать, как использовать данные из социальных сетей, чтобы потом их продать», – говорит доцент ИТМО Андрей Куркин.

Моральные вопросы студентов, по словам профессора, не мучают совсем. «Никто не любит, когда за ним подсматривают, с другой стороны, в соцсетях все происходит добровольно, – говорит Андрей Фильченков. – Анализировать, что показывается в соцсетях, интересно. Если вы не любите, когда за вами смотрят, для вас это минус. Если вам нравится, когда за вас выбирают пиццу, которую вы любите, – это для вас плюс».

Андрей Фильченков, воодушевившись информационным успехом алгоритма определения «занято – свободно» в отношении семейных статусов, предсказывает, что к 2018 году все мы будем окружены всевозможными средствами сбора данных и их анализа. «И это не может нести негативные последствия, например, в медицинской диагностике. Своевременная информация о том, что человек может получить рак в течение 5 лет, – это здорово, – уверен соавтор нашумевшего «семейного распознавателя». – Этот процесс не повернуть вспять. А там глядишь и к искусственному интеллекту подойдем».

Что же касается страхов о способностях государства анализировать собранную о нас информацию из соцсетей, то пока очевидно можно констатировать лишь интерес профильного бизнеса к потенциальным государственным контрактам. В конце минувшего года «О пользе и вреде больших данных» петербуржцам рассказывала президент ГК InfoWatch Наталья Касперская.

Николай Нелюбин, специально для «Фонтанка.ру».


Подписывайтесь на каналы "Фонтанка.ру" в Telegram или Viber, добавляйте нас в Яндекс.Дзен или приходите в группу ВКонтакте, если хотите быть в курсе главных событий в Петербурге - и не только.

добавить комментарий
Помните, что все дискуссии на сайте модерируются в соответствии с правилами блога и пользовательским соглашением. Если вы видите комментарий, нарушающий правила сайта, сообщайте о нем модераторам.
СМИ2
MarketGid News
24СМИ. Агрегатор
Lentainform
Авиакомпания «Уральские авиалинии»
«Уральские авиалинии» пополнили флот 45-м самолетом
Авиакомпания «Уральские авиалинии» активно готовится к летнему сезону 2018 и увеличивает свой авиапарк. Борт под номером VP-BIH стал сорок пятым самолетом в воздушном парке авиакомпании
Магазин "Кей"
Выбираем клавиатуру с подсветкой вместе с сотрудниками КЕЙ
Клавиатура с подсветкой – отличное решение не только для геймеров, но и обычных пользователей. Кроме того, такой аксессуар может стать удачным дополнением к Вашему интерьеру. Разберемся, какой должна быть качественная клавиатура с подсветкой вместе со специалистами компании КЕЙ
предоставлено компанией «O,matras!»
Как выбрать матрас для здорового сна
Удобное спальное место — один из факторов качественного отдыха ночью и бодрости по утрам. Правильно подобранный матрас уменьшает боли в спине, обеспечивает поддержку позвоночнику и суставам, помогает решать проблемы бессонницы из-за дискомфорта в грудном и поясничных отделах
Авиакомпания «Уральские авиалинии»
«Уральские авиалинии» запустили бота-помощника для пассажиров
Что такое сервис «Электронный помощник» авиакомпании «Уральские авиалинии» и чем он полезен?
Магазин "Кей"
7 критериев удачного выбора качественной мультиварки от экспертов КЕЙ
Чуть более 5 лет назад на рынке кухонных приборов появились многофункциональные чудо-кастрюли, упрощающие процесс приготовления пищи – мультиварки. Если вы решили обзавестись таким девайсом, то воспользуйтесь полезными советами специалистов компании КЕЙ
фото предоставлено компанией «Ойкумена»
Во дворе ЖК «Граффити» появятся шесть континентов
Компания «Ойкумена» представила проект благоустройства третьей очереди ЖК «Граффити» (корпуса 1.7, 1.8, 1.9, 1.10). Он будет выполнен согласно концепции «Географические открытия», которая превратит двор в карту мира с символами всех континентов. Автор проекта - финское проектное бюро Румпу.
фото предоставлено компанией ООО "Эльдорадо"
«Эльдорадо» подарит скидки в честь открытия магазина на Энгельса.
Грандиозное открытие нового, восемнадцатого магазина сети «Эльдорадо» в Петербурге пройдет с 19 по 22 апреля в ТК «Озерки». Покупателей ждут скидки до 50%, подарки, бонусы* и беспроцентная рассрочка**.
Setl City
Setl City организовала субботник во дворах 14-15 очереди квартала «Лондон»
Сотрудники компании Setl City и подрядной организации «ДВК-Инжиниринг» 14 апреля вышли на субботник в 14-15 очереди квартала «Лондон» микрорайона «Семь столиц» в Кудрово. В рамках субботника с территории вывезли строительный мусор, очистили газоны и вымыли дорожки, прилегающие к Английской ул. и пр. Строителей
АО "Концерн ВКО "Алмаз - Антей"
«Алмаз-Антей» готов расширить производство оборудования для нефтегаза
АО «Концерн ВКО «Алмаз-Антей» впервые примет участие в Международной выставке оборудования и технологий для нефтегазового комплекса «НЕФТЕГАЗ-2018». Концерн представит потенциальным партнерам свои возможности для разработок и готовое оборудование.