Балашов, Б. М. Большие данные и их применение в предвыборной борьбе / Б. М. Балашов. // Международный журнал гуманитарных и естественных наук. – 2017. – 11. – С. 46-50.

БОЛЬШИЕ ДАННЫЕ И ИХ ПРИМЕНЕНИЕ В ПРЕДВЫБОРНОЙ БОРЬБЕ

 

Б.М. Балашов, студент

Научный руководитель: Г.Г. Козлова, канд. экон. наук, доцент

Московский технологический университет

(Россия, г. Москва)

 

Аннотация. В настоящее время большое внимание уделяется информационной поддержке всех политических и экономических процессов. В статье описывается понятие большие данные. Рассматриваются проблемы их обработки. Приводится обзор их применения в политической деятельности. Рассматривается использование больших данных в предвыборной кампании США 2017 года.

Ключевые слова: большие данные, Big Data, политика, применение, информация, объем данных, информационные технологии, ценнозы.

 

 

«Кто владеет информацией, тот владеет миром» [1]. Эта цитата принадлежит английскому банкиру Натану Майер Ротшильду. И в наше время ее знаю практически все. Действительно, ведь мы живем в век информационных технологий в информационном обществе, где информация стала главным ресурсом для достижения целей практически в любой сфере деятельности.

Но что же делать, если информации стало столько, что найти в ней необходимую малую часть, зачастую, стало задачей невыполнимой? На 2016 год общий объем цифровой информации в мире измерялся как 16 зеттабайт (16 трлн ГБ), для сравнения: в 2011 году объем информации был 1,8 зеттабайт, а на 2025 год прогнозируется показатель в 163 зеттабайта [2]. Ежемесячно человек принимает такое количество информации, сколько человек в 18 веке принимал за всю свою жизнь. Так как же разобраться в таком многообразии записей, статей, публикаций, фотографий, и осуществить поиск среди множества данного многообразия, ту часть, являющейся нужной?

2 октября 2009 года английский журналист издания Nature Клиффорд Линч, обнародовал номер с главной темой: «Какое влияние оказывают на будущее информационные технологии, которые формируют способы работы с колоссальными объёмами информации?», в котором были сформированы факты о значительном росте объёма данных. Отсюда и пошло понятие «большие данные» или же, как он звучит в оригинале, «Big Data».

Big Data (от англ. – «большие данные») [3] одно из часто употребляемых на данный момент понятий в ИТ-сфере. Под названием Big Data могут иметься в виду сведения колоссальной величины, а также технологии их анализа, планы, рынок и даже организации, которые используют данную технологию. На самом деле, понятие Big Data очевидно: «большие данные», которые означают ведение и анализ большого количества информации. Если же вдаваться в подробности, то это данные, которые не поддаются обработке классическими способами из-за больших объемов.

В общих чертах, технология обработки большого количества информации можно свести к трем тенденциям, которые решают три основных вида задач [4]:

 преобразование поступаемых данных в гигабайты, терабайты и зеттабайты, а также их хранение, обработка и практическое применение.

 структуризация разобщенного контента: текстов, изображений и других видов данных.

 исследование Big Data и внедрение разных методов анализа неструктурированной информации, а также формирование разнообразных исследовательских умозаключений.

Строго говоря, использование Big Data включает в себя работы с колоссальным объемом информации, часто обновляемой и раскиданной по различным сферам деятельности человека.

Основной методикой для обработки больших данных является методика MapReduce. Ее схема такова: есть кластер компьютеров, на один из компьютеров (главный узел) поступает вся входная информация по решаемой задачи, далее он разделяет ее на части и передает остальным компьютерам (рабочим узлам) для дальнейшей ее обработки, сортировки по группам, тематикам и т.д., затем подобная информация собирается со всех компьютеров в одну группу и передается обратно на главный узел для дальнейшей работы с ней в уже воспринимаемым человеком виде, и при этом если один из узлов кластера (один из компьютеров) выходит из строя, то информация не теряется, она равномерно распределяется по оставшимся узлам, тем самым можно избежать потери каких-либо данных из-за технической неисправности. Сейчас существует множество методов обработки больших данных, но так или иначе у многих из в них в основе лежит данная схема.

Применение Big Data

Применение больших данных становится все более и более популярнее во всех сферах, будь то маркетинг, медицина и здравоохранение, банковский сектор, или же, как в нашем примере, применение таких методов набирает большие обороты в политике [5].

В статье более подробно будет рассмотрено применение больших данных в политике на примере предвыборной компании Дональда Трампа, который с успехом применил их в борьбе за президентскую должность.

Применение больших данных в США активно начало развиваться еще при Бараке Обаме. В свое время он инвестировал более 200 млн долларов в развитие данных технологий в различных сферах, так как считал, что за большими данными кроется будущее. И за его такое стремление он был даже прозван как «Big Data President». Но в действительности более широкая огласка данной темы произошла во время президентских выборов в США в 2016 году, когда эти методы были применены, и во многом обеспечили успех в политической борьбе, стороне Дональда Трампа.

Вначале расскажем не много о том, что надоумило Трампа использовать такие методы в своей программе. Ну, точнее не самого Трампа лично, а всю его компанию.

К концу июля 2016 года Дональд Трамп отставал на 25-40% в опросах американского народа своему конкуренту Х. Клинтон. В следствие этого, известный американский политический деятель, Стивен Бэннон решил оказать помощь Трампу. Он принял решение использовать экстраординарную стратегию для того, чтобы вывести Трампа на лидирующие позиции. Но Бэннон отчетливо осознавал, что одному этого не добиться, и он прибегнул к помощи влиятельного бизнесмена Питера Тиля (известный инвестор в неординарные проекты).

Чтобы вывести Дональда Трампа на лидирующие позиции, Бэннон и Тиль применили информационно-аналитические методы компании Palantir. Данные методы позволяют анализировать колоссальные объемы различной информации. (тексты, денежные переводы, интернет-данные и так далее). А также представляют возможность для визуализации полученных данных, что, безусловно, позволяет лучше воспринимать полученную информацию человеком. В конечном счете, самое главное, что понравилось многим финансистам и политическим деятелям в комплексе методов Palantir – возможность находить аномалии в разных процессах и событиях на основе больших данных.

Palantir [6] дала возможность найти аномальные штаты. В США некоторые штаты почти всегда отдают свои голоса лицам из республиканской партии, очень редко – демократам. Существуют и штаты, которые не определились в своем выборе. Прежде, чем Palantir сделал свои выводы, республиканская партия усердно стремилась перетащить на свою сторону колеблющиеся штаты. Благодаря аналитическим методам Palantir обнаружилось, что есть десять штатов, из них четыре – демократических, в которых протекают аномальные действия. Аномалии представляют собой те события, которые дают возможности к изменениям.

В равной мере была использована еще одна компания «Quid» (руководителем компании является Шон Горли). Программа компании Quid включает в себя аналитические, исследовательские и прогнозные методы, которые рассматривают финансовые и политические организации, а также конфликтующие стороны, как своего рода машины. Шон Горли и его методы исследуют их как совокупность устройств – ценоз. Ценозы Ш. Горли дают возможность поиска областей, которые отображают динамику системы и наиболее чувствительны к некоторым изменениям. Методы компании Quid осуществляют поиск таких областей, где небольшие изменения оказывают максимальное воздействия в нужной сфере.

Благодаря Quid было ясно показано, что есть отдельные штаты, в которых используя точечные воздействия можно достичь успеха в пользу Д. Трампа. Вдобавок выигрыш в данных штатах позволит Трампу одержать верх в президентской гонке.

Количество аномальных штатов, приобретенных Palantir, было снижено до шести, согласно предсказанию компании Quid. На этом деятельность IT-специалистов в избирательной кампании Трампа не закончилась. Существенной работой было обнародование количественных прогнозов в реальные действия.

В начале ноября Бэннон и его команда разработали программу Winagain. Итог, полученный Palantir и Quid были отданы компании Cambridge Analytica [7] (компания, занимающаяся использованием методов психологического воздействия в социальных сетях).

На данный момент известно, что любое действие в интернете, будь то покупка онлайн, поиск какого-либо запроса, либо просто обычное действие в соцсетях, например, лайк (комментарий, репост) не остается бесследным, оно сохраняется, и благодаря сохраненной информации далее любому человеку выдается реклама, например, походного набора для путешествия, если человек незадолго искал что-то об отдыхе в горах.

Но перед тем как приступить к тому, как это все помогло Cambridge Analytica и Трампу, хотелось бы рассказать не много о том, на чем основано психологическое воздействие, то есть таргетирование в сети.

В 2008 году студент Кембриджского университета, центра психометрии, Михал Козинский вёл разработку модели, на основе которой можно составить практически полный портрет человека, который так или иначе ведет активность в сети. Основывалось это прежде всего на опросах, которые ранее были запущены целым приложением в сети Facebook, тем самым люди оставляли о себе те данные, проанализировав которые, можно было сделать достаточно точный психологический портрет тестируемого, а после, проведя анализ поведения личности в сети, т.е. посмотреть, под какими фотографиями человек ставит лайки, на какие группы подписан, посмотреть список его друзей, портрет был настолько полон, что Козинский доказал, что 68 лайков в Facebook достаточно, чтобы определить цвет кожи испытуемого (с 95% вероятностью), его гомосексуальность (88% вероятности) и приверженность Демократической или Республиканской партии США (85% вероятности).

И что же из этого вышло, у компании, занимающийся таргетированием, в руках есть колоссальное количество данных, наработки, полученные Palantir и Quid ранее, и система, разработанная Козинским.

Cambridge Analytica связывает сведения зарегистрированных последователей (партий) и сведения в Facebook, в результате формируется собственный профиль человека. Из количественных сведений обнаруживаются люди со страхами, определенными потребностями, уязвимыми местами, определенными чертами характера и поведения, а также с местом проживания. Тем самым Cambridge Analytica в шести ключевых штатах определила сообщества, которые помогли, в конечном счете, принести победу Д. Трампу на выборах в стране.

Cambridge Analytica устанавливала в основных штатах место проживание значимых для исхода предвыборной компании избирателей и их объединения. В пределах объединений, Cambridge Analytica анализировала психологические портреты лидеров и их сторонников.

Затем сведения переходили в избирательный штаб, который находился под ведением Бэннона. В соответствие с планом С. Бэннона, в каждом определенном штате, значимом для избирательной компании, были сформированы группы, которые включали в себя добровольцев и граждан, разгневанных элитами. Команды Бэннона оказывали помощь людям в формировании групп действия. Главной целью этих групп было – заручиться поддержкой избирателей, которые проголосуют именно за Трампа. С июня 2016 года добровольцы избирательной кампании Д. Трампа получили документ, в котором было сказано о личностных характеристиках и политических предпочтениях людей определенного штата. А именно, добровольцы провели интервьюирование с жителями штата исходя из этих данных. Полученные сведения добровольцы фиксировали в этом же документе и отправляли в компанию Cambridge Analytica.

Действия добровольцев-волонтеров контролировались с применением социальных сетей. Наверное, еще никогда социальные сети в президентской избирательной кампании не были использованы так масштабно.

В день прений между Трампом и Клинтон камлания Трампа отправила в социальные сети, а именно Facebook около 200 тыс. различных сообщений. Они отличались всего лишь в незначительных формулировках, чтобы предельно ясно и точно психологически донести информацию до конкретных получателей.

В какой степени народ США обрабатывался приверженцами Трампа, трудно сказать, так как они почти не появлялись на центральных телевизионных каналах, а чаще всего использовали социальные сети.

Таким образом, основываясь на всем вышесказанном, можно сделать вывод, что Big Data действительно становятся очень сильным оружием в политической борьбе. Да и если так посмотреть, то не только в политике они становятся одним из главных оружий, сейчас трудно представить какую-либо сферу, где хоть сколько-нибудь не применялись бы большие данные. Везде, где бы они не применялись, будь то медицина, маркетинг да или даже политика, в каждой сфере они вносят свой какой-то переворот, с их помощью можно добиться более мощных результатов, на основе анализа больших данных, можно выявить принципиально новые стороны рассмотрения каких-либо вопросов и найти новые пути решения. Ну и естественно, что больший эффект на людей будет оказывать контент, подобранный исходя из личных предпочтений каждого, нежели толпы. После триумфа Cambridge Analytica в штабе Трампа, к их дверям строится очередь, и уже есть данные, что Швейцария и Германия ведут совместную работу с компанией, а также кандидат в президенты Франции Марин Ле Пен сотрудничает с ними. Конечно, однозначно нельзя сказать, что только на основе больших данных состоялся триумф Трампа, но все же они сыграли действительно немаловажную роль в этом, и многие крупные компании не только за рубежом, но и в России ведут свои собственные разработки в сфере применения Big Data, так что политик, имя которого упоминается в начале, скорее всего действительно был прав, говоря, что за большими данными, кроется большое будущее, ибо сейчас сила их применения как никогда ранее доказывается на практике.

 

Библиографический список

1. Кеннет Кукьер. Большие данные. – 2015. – С. 25-30.

2. Эрик Сигель. Предсказательная аналитика. – 2014. – С. 101-114.

3. Понятие «Big Data» 2017. – Общий доступ – URL: [https://ru.wikipedia.org/wiki]

4. Что такое большие данные – 2016. – Общий доступ – URL: [https://habrahabr.ru/post/]

5. Натан Марц. Big Data, 2016. – С. 85-89.

6. Большие данные – большие возможности. – 2014. – Общий доступ – URL: [https://www.dellemc.com/]

7. Карл Андерсон. Аналитическая культура. – 2016. – С. 36-48.

 

 

BIG DATA AND THEIR USE IN THE ELECTION CAMPAIGN

 

B.M. Balashov, student

Supervisor: G.G. Kozlova, candidate of economic sciences, associate professor

Moscow technological university (MIREA)

(Russia, Moscow)

 

Abstract. Currently, much attention is paid to the information support of all political and economic processes. The article describes the concept of big data. Deals with the problems of their treatment. Provides an overview of their application in political activities. Discusses the use of big data in the election campaign of the USA 2017.

Keywords: big data, Big Data, policy, application, information, data volume, information technology, cenoz.