23:51 11.12.2017
СМИ: ФСБ задержала россиянина по обвинению в шпионаже
Судья штата Нью-Йорк не стал рассматривать иск русских банкиров: «Елки-палки, почему я должен утруждать себя этим делом?!»
Диетологи рекомендуют продукты от бессонницы
Российские гандболистки вышли в четвертьфинал чемпионата мира
Манчини: «Зениту» нужен футболист, который сможет забивать много голов
Шойгу: Российские военные уже начали возвращаться из Сирии
СМИ: Оптовые цены на бензин пошли вниз, но на заправках топливо не подешевеет
УЕФА расследует нарушения во время матча «Зенит»-«Реал Сосьедад»
Террорист из Бангладеш устроил взрыв в Нью-Йорке из мести
«Зенит» не сумел победить «Ахмат» и отстал от «Локомотива» на 8 очков
Корифеи петербургской театральной сцены награждены премией имени Андрея Толубеева
Суд отказался арестовывать Михаила Саакашвили
«Фонтанка.ру» и журнал «Город 812» назвали самых влиятельных людей Петербурга
«Событием Года - 2017» стал запуск всех участков ЗСД
Из-за разногласий между ведомствами пенсионной реформой займётся новое правительство после президентских выборов
«Фонтанка» и «Город 812» назвали самых влиятельных пиарщиков года
Судно «Монни», затонувшее возле Усть-Луги, подняли на поверхность
«Фонтанка.ру» и журнал «Город 812» назвали самых влиятельных строителей Петербурга
«Фонтанка» и «Город 812» назвали самых влиятельных людей в энергетике, городском хозяйстве и частной медицине
В Главном штабе определили десятку самых влиятельных бизнесменов Петербурга
На оранжевой ветке поезда идут с увеличенным интервалом
Автор смертельной трансформации любовного треугольника в дуэт арестован в Петербурге
В Петербурге назвали самых влиятельных медиа-менеджеров года
"Фонтанка" за 60 секунд - 11 декабря
Названы самые влиятельные чиновники Петербурга
Самые влиятельные управленцы Петербурга работают в «Газпроме», Сбербанке и ВТБ
Петербургские депутаты оккупировали рейтинг влиятельных политиков города
Михаил Пиотровский возглавил рейтинг влиятельных деятелей культуры в Петербурге
Информатора WADA Родченкова обвиняют в незаконном обороте сильнодействующих средств
Рогозин: «Роскосмос» установил причины аварии спутника «Метеор-М»
Власти Нью-Йорка назвали взрыв на автовокзале несостоявшимся терактом
Массовое ДТП собрало 5-километровую пробку на Энгельса
«Приморская» открыта для пассажиров
Чистый отток капитала из России вырос почти в 3,5 раза
«Фонтанка» и «Город 812» назовут сегодня самых влиятельных петербуржцев
«Приморская» закрыта на вход и выход
Предполагаемый лидер петербургского ИГ попросился на свободу
Манчини: Не думаю, что нам повезло с «Селтиком»
Путин: Решение Трампа о признании Иерусалима считаю «контрпродуктивным»
Устроивший взрыв в Нью-Йорке 7 лет назад приехал в США из Бангладеш
Обвиненный в похищении человека транспортный полицейский освобожден из СИЗО
Путин: Россия готова открыть авиасообщение с Египтом
Набережную Адмиралтейского канала могут отдать под пешеходную зону
Неизвестная Финляндия: куда поехать на выходные?
Бдительный таксист помог поймать любителя «пьяной езды» в Пушкине
В Нью-Йорке взорвалась самодельная бомба из водопроводной трубы, задержан подозреваемый
Фурсенко: «Зениту» выпал удачный жребий в 1/16 финала Лиги Европы
«Нелюбовь» Андрея Звягинцева претендует на «Золотой глобус»
Голландская болезнь вынудила вырубить вязы в парке Строителей
Главу «Молодой гвардии» в Петербурге отправили в отставку
Петербуржцы после пятичасового ожидания вылетели в Китай
Дело экс-губернатора Коми Гайзера дошло до суда
Полиция Нью-Йорка расследует возможный взрыв на автовокзале в Манхэттене
На юго-западе Петербурга не дали лопнуть трубе, но в домах все равно может похолодать
Дмитрия Месхиева предложили исключить из Союза кинематографистов
На Минобороны пожаловались из-за двусмысленной запятой
В Петербурге дважды за ночь разведут Тучков мост
За требование взятки 10 млн в Петербурге приговорены бывшие сотрудники Наркоконтроля
В Петербурге зарегистрировали «свиной» грипп
У задолжавшего за аренду резидента ОЭЗ «Новоорловская» Смольный хочет забрать участок
«Зенит» сыграет в 1/16 финала Лиги Европы с «Селтиком»
Екатеринбургский хакер заявил, что взламывал серверы Демпартии США по заданию ФСБ
Кандидат в вице-губернаторы: Мне поручат курировать инвестиции, природу и промышленность
Рейс из Петербурга в Санья задержан почти на 5 часов
Sberbank CIB профинансировал Fort Group на покупку московских торговых центров
Прокуратура внесла представление главе «Союзмультфильма»
«Черную речку» проверили за час
В Петербурге приставы за взятку спрятали от банка автомобиль должника
Дело об убийстве с расчленением ради миллиона передано в суд в Петербурге
Два района Ленобласти рискуют остаться без тепла на Новый год
Общество

Матрице известно все. Даже то, что Трамп - холостяк

Студенты и сотрудники Университета ИТМО создали алгоритм, определяющий семейное положение пользователей c точностью до 86%. Как еще умеют использовать Big Data в России - изучала «Фонтанка».
Матрице известно все. Даже то, что Трамп - холостяк
фото с сайта twitter.com

Ни один шаг в соцcетях не ускользает от тех, кто умеет управлять большими данными. Специалисты технологий обработки больших массивов данных и их взаимосвязей (Big Data) могут узнать и семейное положение, и предпочтения в еде, и политические активности. Все эти сведения в ежедневных терабайтах «потребляют» бизнесмены, предлагая пиццу нужного вкуса или новости о нравящемся кандидате в президенты. И пока эксперты ещё определяются с тем, что можно, а что нельзя относить к термину Big Data и стоит ли нам бояться «всевидящего ока», профилирование пользователей соцсетей уже вдохновляет сотни стартаперов и студентов, оттачивающих мастерство дата-аналитики. 

Например, студенты и сотрудники Университета ИТМО совместно с Национальным университетом Сингапура создали алгоритм, определяющий семейное положение пользователей c точностью до 86%, используя данные трех соцсетей. Исследователи объединили данные из Twitter, Instagram и Foursquare и утверждают, что параметр «семейности» угадывается с точностью до 86%, что на 17% точнее, чем по одной из соцсетей.

«Мы определяем не юридический статус человека, а занято его сердце или нет, – рассказал в эфире интернет-канала [Фонтанка.Офис] математик ИТМО Андрей Фильченков, один из разработчиков алгоритма. – Пока мы используем аккаунты на английском языке. Но факт остается фактом: если человек захочет проверить, есть ли кто-то у его девушки, то он сможет это сделать».

Андрей Фильченков попытался в прямом эфире проанализировать твиттер Дональда Трампа. Рабочий алгоритм использует для анализа средний размер твитта, наиболее частые объекты на фото, распределение чекинов и так далее. Проанализировав твитты Трампа, Андрей Фильченков пришел к выводу, что он… холост. «У него за месяц написаны десятки сообщений, – прокомментировал математик. – Хотя тут  мы отчасти определяем, и женат ли Трамп, и женаты или замужем его помощники, ведущие Твиттер».


В анализе открытых данных всегда есть один нюанс: если человек врет, то матрица бессильна. Например, известный факт, что мужчины чаще указывают в статусе, что они не в браке, а на самом деле все ровно наоборот. Кроме того, соцсети неохотно расстаются с любой информацией, даже открытой, если ее можно продать. 

«Соцсети очень чувствительны к тому, что данные используются без согласования с пользователями, – пояснил Андрей Фильченков. – Поэтому для нашего эксперимента данные собираются вручную, хотя могу легко написать алгоритм, чтобы автоматически скачивать информацию из того же Твиттера».

К данным пользователей трепетно относятся и российские соцсети. Например, «ВКонтакте» в конце января подала иск в Арбитражный суд Москвы к Double Data и Национальному бюро кредитных историй. По данным ряда СМИ, соцсеть требует прекратить использование данных пользователей для оценки их кредитоспособности.

Вопрос регулирования Big Data уже поднимается и на государственном уровне. Не далее чем в конце прошлого года Роскомнадзор заявлял о необходимости законодательного ограничения в вопросах идентификации человека в соцсетях и прогнозирования его поведения. Пока дело ограничилось рабочей группой под предводительством советника президента по Интернету Германа Клименко. На базе Координационного центра национального домена сети Интернет представители Минкомсвязи и игроки телеком-рынка будут пытаться понять, по каким параметрам Big Data можно зарегулировать.

Тем не менее, как считает соавтор алгоритма предсказания семейного положения Ксения Бурая, которую цитирует ИТМО, профилирование пользователей могут использовать, например, рекрутеры, чтобы узнать больше о людях, которые устраиваются на работу. 

«Если говорить глобально, характеристика личности по активности в соцсетях позволит вычислять членов опасных группировок, а также находить людей, склонных к депрессии или самоубийству, и предлагать им своевременную помощь», – поясняет Ксения Бурая, которая в эти дни представляет разработку в Сан-Франциско, на тематической научной конференции.

«Если не говорить о проектах, которые используют спецслужбы – Палантир в США, например, то мониторинг социальных сетей – самый распространенный из инструментов по работе с большими данными, – говорит и  основатель сервиса для аналитики и продвижения в мессенджерах Комбот Федор Скуратов. – Практически любой современный IT-проект работает с Big Data. А у термина, строго говоря, даже нет количественного обозначения. Что такое Big Data? 1 мегабайт, 100, терабайт? Количество записей в базе? В общем, коммерческим является все, что участвует в цепочке работы с данными, от баз до особо мощных видеокарт, заточенных под работу анализирующих эти данные нейросетей. Среди известных простому пользователю проектов – FindFace. А так... мы все сталкиваемся с Big Data каждый день, заходя в «Фейсбук».

Коммерческий директор Bell Integrator Александр Молодцов привел еще один пример широкого применения Big Data потребителями – сравнение ценовых предложений. «Такие сервисы, как «Яндекс.Маркет» и booking, базируются на Интернете, сайты знакомств, позволяющие осуществлять поиск по ряду параметров (возраст, образование, интересы), – тоже пример использования данной технологии».

Чисто коммерческие проекты, такие как интернет-таргетинг, быстрее адаптируются и находят свою нишу и своих клиентов. В решении остросоциальных вопросов Big Data пока мало помогает. Например, определить местоположение человека, попавшего в беду и не выходящего на связь с родственниками, технически можно в считанные секунды. Однако законодательная база не предусматривает такого быстрого взаимодействия.

«Загвоздка в методах преподнесения этой информации, – уверен доцент кафедры интеллектуальных технологий в гуманитарной сфере ИТМО Андрей Куркин. – На Западе такая работа активно используется, в логистике например. В России это только зарождается. Сейчас, конечно, анализируют визуальные образы – распознание лица. Например, это система видеонаблюдения в аэропорту, когда путем поведенческого анализа можно определить, что пассажир ведет себя нестандартно. Это для студентов практические и дипломные работы. Государство такой заказ пока не формирует. Потом эти студенты идут работать в разные компании, в «Сбертех», «Яндекс», Гугл.

По данным генерального директора "ТМТ Консалтинг" Константина Анкилова, в России рынок Big Data занимает менее 1% от глобального. По итогам 2016 года он составил около 22 млрд руб. По оценкам эксперта, объем мирового рынка Big Data приближается к $ 40 млрд. По словам Константина Анкилова, сегодня даже в мире 60% рынка Big Data занимают поставщики оборудования и софта и только 40% приходятся, собственно, на пользовательский сервис.

«Сегодня в России основным потребителем данной технологии являются банки, – уточняет Александр Молодцов. – Банки используют Big Data с точки зрения двух основных направлений: анализ поведения клиента и предоставление клиентам различных срезов информации». Так, например, в конце 2016 года Сбербанк запустил проект «Открытые данные» – продукт на основе технологии Big Data. Проект призван предоставлять информацию, касающуюся финансовой активности клиентов. Любой человек может зайти на сайт и узнать о средних суммах на кредиты, оценить количество заявок, сравнить динамику зарплат в разных регионах.

Меж тем светлое будущее в плане динамики развития у Big Data, несомненно, есть. «У нас есть студенты действительно интересующиеся, с большим багажом. Это заметно. Они хотят понимать, как использовать данные из социальных сетей, чтобы потом их продать», – говорит доцент ИТМО Андрей Куркин.

Моральные вопросы студентов, по словам профессора, не мучают совсем. «Никто не любит, когда за ним подсматривают, с другой стороны, в соцсетях все происходит добровольно, – говорит Андрей Фильченков. – Анализировать, что показывается в соцсетях, интересно. Если вы не любите, когда за вами смотрят, для вас это минус. Если вам нравится, когда за вас выбирают пиццу, которую вы любите, – это для вас плюс».

Андрей Фильченков, воодушевившись информационным успехом алгоритма определения «занято – свободно» в отношении семейных статусов, предсказывает, что к 2018 году все мы будем окружены всевозможными средствами сбора данных и их анализа. «И это не может нести негативные последствия, например, в медицинской диагностике. Своевременная информация о том, что человек может получить рак в течение 5 лет, – это здорово, – уверен соавтор нашумевшего «семейного распознавателя». – Этот процесс не повернуть вспять. А там глядишь и к искусственному интеллекту подойдем».

Что же касается страхов о способностях государства анализировать собранную о нас информацию из соцсетей, то пока очевидно можно констатировать лишь интерес профильного бизнеса к потенциальным государственным контрактам. В конце минувшего года «О пользе и вреде больших данных» петербуржцам рассказывала президент ГК InfoWatch Наталья Касперская.

Николай Нелюбин, специально для «Фонтанка.ру».


Подписывайтесь на канал "Фонтанка.ру" в Telegram, Viber или группу ВКонтакте, если хотите быть в курсе главных событий в Петербурге - и не только.

СМИ2
MarketGid News
24СМИ. Агрегатор
Магазин "Кей"
5 критериев выбора классной 3D-ручки от экспертов компании КЕЙ
Появившись на рынке не так давно и успев завоевать внимание покупателя, 3D-ручки продолжают набирать популярность, предлагая пользователям все новые и новые возможности
ГК «Эталон»
Ипотека на квартиры «Эталон ЛенСпецСМУ» стала доступнее по субсидированной ставке
С 5 декабря все покупатели квартир «Эталон ЛенСпецСМУ» (входит в Группу «Эталон») могут воспользоваться субсидированной ставкой по ипотеке от ПАО Сбербанк и ВТБ 24 (ПАО)
Фото Андрея Сорокина, ЯСИА (Якутское-Саха информационное агенство)
Кино на якутском показали в «Ленфильме»
Якутия переживает бум национального кино. Каждый год на экраны кинотеатров выходит с десяток фильмов на якутском языке. И это при том, что в регионе живет меньше миллиона человек. 9 декабря в рамках Дней Якутии в «Ленфильме» показали фильм-прорыв этого года – картину «Его дочь» Татьяны Эверстовой
ООО «Терминал-Ресурс»
ООО «Терминал-Ресурс» поборолся за покровительницу шахмат
ООО «Терминал-Ресурс», который входит в группу компаний ООО «Центр развития», принял участие в ежегодном межрегиональном общественном конкурсе в сфере недвижимости «КАИССА-2017»
https://pixabay.com
Виртуальный дом — современный подход к обустройству квартиры для инвалида
Специализированный интернет-магазин товаров для инвалидов «Стар и Млад» представил авторский проект «Виртуальный дом», который позволяет подробно рассмотреть каждое помещение в доме, определиться с самыми проблемными зонами и правильно расставить приоритеты при обустройстве дома для граждан с ограниченными возможностями здоровья и пожилых людей
http://www.aeroflot.ru/ru-ru/about/aeroflot_today/photobank
Аэрофлот получил право отказывать авиадебоширам в перевозке
7 декабря 2017, Москва. – Аэрофлот получает законное право составлять «черные списки» деструктивных авиапассажиров и в дальнейшем отказывать им в перевозке. Президент Российской Федерации Владимир Путин подписал соответствующий пакет законов, который вступит в силу в июне 2018 г