«Большие данные» | Сайт С.П. Курдюмова "Синергетика"

«Большие данные»
Елена Ларина, Владимир Овчинский

23.04.2014

Опубликовано в:

Сети, когнитивная наука, управление сложностью

Большие данные как стратегический ресурс

В последние годы Большие Данные являются общепризнанным трендом экономического и технологического развития. Им посвящены тысячи публикаций. Они относятся к числу наиболее популярных тем, как в специализированных изданиях, так и в различного рода СМИ, рассчитанных на самую широкую аудиторию. В результате возникло впечатление, что Большие Данные – это нечто само собой разумеющееся, ясное, понятное. Широко распространена иллюзия о повсеместном применении Больших Данных в России.

Между тем, дело обстоит совсем не так. Беспристрастный анализ фактических данных показывает, что наша страна существенно отстает в сфере Больших Данных. Значительная часть компаний только используют термин «Большие Данные» в маркетинговых целях, а по сути, применяют старую, хорошо известную бизнес-аналитику, которая заметно отличается от Больших Данных. В стране практически нет спроса на специалистов по Большим Данным. Достаточно посмотреть наиболее популярные порталы работ, чтобы убедиться, что спрос на специалистов по Большим Данным у нас на порядки меньше, чем в США, Европе, Японии, Китае. В то время как во всем мире издаются сотни профессиональных и общедоступных книг по отдельным аспектам Больших Данных, в России только в этом году вышла первая книга по Большим Данным – работа В. Майер-Шенбергера и К.Кукьера «Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим». Да и эта книга носит не профессиональный характер, а написана в жанре нон-фикшн.

Происходящее вызывает особую тревогу в условиях, когда ведущие наднациональные мировые структуры и транснациональные корпорации, правительства ведущих стран мира, бизнес самых различных масштабов, системы управления производственной и социальной инфраструктурой и, конечно же, военно-разведывательный комплекс всех основных стран мира уже используют Большие Данные как важнейший стратегический ресурс.

В этой связи в предлагаемом цикле статей авторы имеют в виду постараться показать скрытые, а в немалой степени сознательно скрываемые возможности и последствия использования Больших Данных не только и не столько в экономической, сколько в политической, социальной и иных сферах жизнедеятельности общества.

Достаточно парадоксально, что до сих пор при широком использовании технологий Больших Данных нет общеупотребительного их определения. Наиболее часто используется популярностью определение Майкла Франклина из Университета в Беркли: «Большие Данные – это любые данные, работа с которыми требует значительных затрат и из которых трудно извлечь информацию». Данное определение кочует из книги в книгу, из работы в работу. Между тем, оно является лучшим подтверждением тезиса о том, что наука о Больших Данные и практические технологии Больших Данных живут в параллельных реальностях. Соответственно, наука о Больших Данных не столько выступает надежным базисом для инженерии данных, сколько намерено или ненамеренно скрывает революционную суть технологий Больших Данных.

В самом деле, определение через большие затраты и трудность обработки может указывать не только на специфические характеристики данных, но и на неэффективность применяемых технологий. По сути, это определение ничего не говорит о том, чем Большие Данные отличаются от просто данных. Казалось бы, штука эта безобидная и носит исключительно академический характер. Однако, на практике это не так. Когда лица, принимающие решения, возможно и не обладающие глубокими профессиональными познаниями, но в подавляющем числе наделенные недюжинным здравым смыслом, встречаются с подобными определениями, у них возникает подозрение, что они имеют дело с очередной маркетинговой уловкой. Суть этой уловки в том, чтобы просто извлечь из организации деньги, заставив ее заплатить за старые решения под новым названием. Несомненно, что непонятность Больших Данных для лиц, принимающих решения, в том числе и у нас, принципиальное отличие технологий Больших Данных от того, что было раньше, стали одними из важных причин, почему Россия и целый ряд других стран, располагающих всеми необходимыми предпосылками для использования этих технологий, на сегодняшний день отстают в гонке цифровых вооружений.

Чтобы разобраться с тем, что такое Большие Данные и в чем принципиальная новизна их технологий, надо для начала отследить время возникновения термина. Сам по себе термин «Большие Данные» появился пять лет назад после публикации специального выпуска ведущего американского научного журнала Nature, целиком посвященного этой теме. Затем тема, как по команде, была растиражирована сначала специализированными IT изданиями, а затем подхвачена элитными СМИ, типа Foreign Affairs, Wall Street Journal и т.п.

Что же произошло пять лет назад? Есть ли какие-то документальные доказательства, что мы не имеем дело с чем-то принципиально новым, а не с хорошо продуманной маркетинговой кампанией по принуждению правительств и корпораций к покупке нового, дорогостоящего софта? Ведь таких примеров в истории IT индустрии было немало. В данном случае твердые документальные доказательства перехода некоего Рубикона имеют место быть.

Во-первых, он связан с достижением интернетом уровня контентной зрелости и перехода в фазу ярко выраженного экспоненциального развития. Эта фаза получила название «информационный взрыв». Примерно, с 2008 года объем информации вновь генерируемой в сети стал удваиваться в течение примерно полутора-двух лет. На сегодняшний день можно привести следующие ключевые характеристики информационного взрыва.

По данным компании Cisco, объем сгенерированных данных в 2012 году составил 2,8 зеттабайт и увеличится до 40 зеттабайт к 2020 г. Примерно треть передаваемых данных составляют автоматически сгенерированные данные, т.е. управляющие сигналы и информация, характеризующие работу машин, оборудования, устройств, присоединенных к интернету, или к интернету вещей. Причем с каждым годом доля интернета вещей или как его сегодня еще называют «интернета всего» растет в общем объеме мировых информационных потоков. На 40% ежегодно увеличивается объем корпоративной информации, передаваемой и хранящейся в сети интернет.

Число пользователей интернета в мире к концу 2013 года составило 2,7 млрд. человек, или 39% населения земли, а к 2016 году эта доля составит 65-75% населения по данным Центра новостей ООН. Как ожидается, количество корпоративных пользователей интернета во всем мире увеличится с 1,6 миллиарда в 2011 году до 2,3 миллиарда в 2016 году.

Во-вторых, примерно в этот период времени появились и стали доступны для корпоративных пользователей принципиально новые IT решения, позволяющие в режиме реального времени обрабатывать практически безразмерные массивы данных самого различного формата. Причем, эти решения сразу же стали реализовываться не только как программные платформы, устанавливаемые на серверы, но и как облачные вычисления, где от организации не требовалось наличия огромной инфраструктуры компьютерного железа.

В-третьих, к концу нулевых годов западные, прежде всего, американские поведенческие и когнитивные науки, с одной стороны получили широкое признание со стороны бизнес-сообщества и государств, а с другой, из фазы исследований и разработок перешли в стадию производства эффективных технологий. Косвенным показателем этого процесса стал тот факт, что в течение нулевых годов три виднейших представителя поведенческих наук: Д.Канеман, Дж.Акерлоф и П.Шиллер получили Нобелевские премии по экономике. Экономика была выбрана лишь потому, что Нобелевских премий в сфере наук о человеке просто не существует.

Теперь давайте вдумаемся, чем же, по сути, является интернет. Причем, без разницы, о каком интернете мы говорим – об интернете людей или об интернете вещей. Не надо обладать глубокими техническими знаниями, чтобы понять, что фактически интернет является хранилищем, своеобразным архивом следов человеческой деятельности. Причем, не только той деятельности, которая реализована в конкретных поступках, действиях, событиях, но и архивом намерений, мнений, мыслей и отношений. Не зря знаменитый американский автор бестселлеров Маршалл Смит уподобил интернет толще земли, в которой можно обнаружить след доисторического животного, умершего миллионы лет назад. По сути, в интернете ничего не исчезает. Даже популярные в постсноуденовскую эпоху различного рода сервисы удаления аккаунтов и других следов пребывания в сети, удаляют лишь те следы, которые доступны для наблюдения простыми пользователями, не вооруженными специальными программами, доступными для корпораций и государств.

Соответственно формирование огромного, постоянно пополняющегося архива поведенческой активности самых различных субъектов, от отдельных государств и огромных компаний до небольших групп и отдельных индивидуумов собственно и послужило базисом появления Больших Данных. C тех пор направление Больших Данных стало ведущим в сфере информационных технологий.

Анализ накопленного за последние годы опыта применения технологий Больших Данных позволяет выделить несколько ключевых черт, отличающих Большие Данные от всех других информационных технологий. К ним относятся:

- во-первых, огромные массивы разнородной информации о процессах, явлениях, событиях, различного рода объектах и т.п., пополняемые непрерывно в режиме он-лайн. Согласно имеющейся статистике 60% этой информации носит неструктурированный, в основном текстовой характер и 40% составляет структурированная, или табличная информация. В последние годы в общем объеме Больших Данных постоянно нарастает доля информации структурированного характера, поступающей от вещей, соединенных с интернетом – от холодильника, до городской системы регулирования светофоров и т.п.;

- во-вторых, специально спроектированные программные платформы, где Большие Данные любого объема могут храниться в удобном для вычислений виде. Особо надо подчеркнуть, что эти архивы отличаются от привычных баз данных, которые приспособлены только для структурированной или табличной информации. Отличительной чертой этих хранилищ является то, что структурированная и неструктурированная информация могут обрабатываться совместно, как единое целое;

- в-третьих, наличие различного рода математического, прежде всего, статистического инструментария для обработки Больших Данных и получение результатов в виде, понятном для человека. Причем, при анализе Больших Данных используются не только традиционные методы математической статистики, но и алгоритмы распознавания образов, нейронные сети, построенные по дальней аналогии с работой человеческого мозга и т.п.

По данным различных исследований, не более 0,6% всей имеющейся сейчас информации подпадает под категорию Больших Данных, т.е. накапливается, хранится и перерабатывается. В этих же исследованиях указывается, что потенциально в качестве Больших Данных может использоваться 23% всей хранимой в настоящее время информации. Т.е. фактически сейчас из всей этой информации используется как Большие Данные, т.е. обрабатывается, анализируется чуть больше 3%. Между тем, последние достижения в области создания платформ накопления, хранения и обработки объемов данных всех форматов позволяют увеличить потенциальные Большие Данные с 23 до примерно 40% всей передаваемой в сетях информации.

Еще в 2011 году McKinsey Global Institute объявил Большие Данные «следующим рубежом для инноваций, конкуренции и производительности». По данным целого ряда ведущих международных деловых изданий, уже сегодня Большие Данные дают заметный эффект в бизнесе. Например, выяснилось, что в транснациональных компаниях, входящих в список Fortune 500, где, казалось бы, до мелочей отлажены все процедуры и процессы, внедрение технологий Больших Данных на 5-7% увеличило эффективность использования ресурсов – труда, основных производственных фондов, энергии и т.п. и на 7-9% обеспечило рост объемов продаж. Для среднего бизнеса показатели оказались в полтора-два раза выше. Причем, следует отметить, что данные получены в условиях, когда мировая экономика испытывает на себе последствия глубочайшего финансово-экономического кризиса и экономический рост измеряется в лучшем случае 1-2%.

На чем же базируется эффективность Больших Данных? Технологии Больших Данных и прежде всего, методы статистического анализа, компьютерного распознавания образов и т.п., применяемые на огромных, постоянно пополняемых массивах данных позволяют:

- проводить самые различные и сколь угодно подробные классификации той или иной совокупности людей, компаний, иных объектов по самым разнообразным признакам. Такие классификации обеспечивают точное понимание взаимосвязи тех или иных характеристик любого объекта – от человека до компании или организации, с теми или иными его действиями;

- осуществлять многомерный статистический и иной математический анализ. Этот анализ позволяет находить корреляции между самыми различными параметрами, характеристиками, событиями и т.п. Корреляции не отвечают на вопрос – почему. Они показывают вероятность, с которой при изменении одного фактора изменяется и другой. В каком-то смысле Большие Данные представляют собой альтернативный традиционной науке метод. Наука на основе теоретических моделей отвечает на вопрос – почему, а затем, получив ответ, делает рекомендации, как действовать. В случае корреляции стадия поиска причины ликвидируется, а действие происходит в тех случаях, когда факторы тесно взаимосвязаны и на один из факторов легко или возможно осуществить целенаправленное воздействие;

- прогнозировать. На основе классификаций и аналитических выкладок осуществляется прогнозирование. Суть прогнозирования состоит в том, чтобы на основе корреляции определить наиболее легкий способ воздействия для того, чтобы один набор факторов, характеризующих тот или иной объект, лицо, компанию, событие и т.п. был преобразован в другой.

Как любой новый технологический пакет, Большие Данные тут же обросли мифами и заблуждениями. Многие из них постоянно усиливаются как самими производителями программных продуктов в сфере Больших Данных, так и средствами массовой информации, вынужденными адаптировать сложные вопросы информационных технологий до читателей, не обремененных излишними знаниями.

Из всей совокупности мифов стоит выделить три главных. Именно они наносят наибольший вред технологиям Больших Данных и тормозят их практическое применение, в том числе в нашей стране.

Прежде всего, в маркетинговых целях прикладываются немалые усилия, чтобы представить технологии Больших Данных неким новым Святым Граалем. На них необоснованно возлагается роль панацеи от всех бед. Между тем, очевидно, что любой технологический пакет имеет строго определенные условия для своего применения. Касательно Больших Данных таким ограничением является сопоставимость текущей ситуации с ранее наблюдавшимися ситуациями, процессами, периодами времени и т.п. В качестве примера можно привести прогнозирование потребительского поведения. Каждый человек на собственном опыте знает, что в ситуации умеренной инфляции он будет делать одни покупки, а при гиперинфляции его потребительское поведение коренным образом изменится. Если уже имеются Большие Данные как по периоду с низким уровнем инфляции, так и ситуации гиперинфляционного шока, то технологии Больших Данных будут полезны. Они позволят распознать, к какому классу относится текущая ситуация, обратиться к соответствующим поведенческим паттернам, характеризуемым теми или иными параметрами, и позволят дать достаточно достоверный прогноз. А вот если Больших Данных по периоду гиперинфляции нет, а она наступила, то в такой ситуации технологии Больших Данных будут бесполезны. Более того, их применение чревато непоправимыми ошибками. Этот пример показывает: технологический пакет Больших Данных, также как и другие технологические пакеты имеют строгие условия, где его применение эффективно, а где – нет.

Бытует мнение, что Большие Данные могут применяться только государственными структурами и транснациональными корпорациями, и недоступны для других субъектов. Связано это с дороговизной как серверной части, так и программного продукта, требуемого для работы с Большими Данными. И, наконец, с высокой зарплатой специалистов по Большим Данным. На практике в последние пару лет пользу из Больших Данных извлекают не только гигантские, но и небольшие структуры. Это стало доступным благодаря облачным вычислениям. В этом случае небольшие структуры выступают конечными пользователями технологического пакета, который получают как услугу. Использование этой технологии, как показывает опыт небольшого и среднего бизнеса в США, Западной Европе и Японии дает компаниям неоспоримые конкурентные преимущества по сравнению с бизнесами, которые подобными возможностями не располагают.

Наконец, очень серьезным заблуждением является рассмотрение технологического пакета Больших Данных как чисто машинной технологии. Многие государственные и корпоративные структуры впустую затратили огромные суммы средств только потому, что все ресурсы были направлены на закупку компьютерного железа и программных продуктов. При этом, затраты на кадры формировались по остаточному принципу. Между тем технологии Больших Данных требуют специалистов высочайшего уровня квалификации, как правило, обладающих образованием и профессиональными навыками не только в области информационных, но и гуманитарных наук. Сегодня, например, в США по оценкам экспертов не хватает от 50 до 70 тыс. специалистов по данным (data scientists). Большие Данные представляют собой не машинную, а человеко-машинную технологию.

Это наглядно показал пример любимого детища АНБ, компании П.Тиля Palantir. Одна из версий программы ориентирована на борьбу с мошенничествами в крупных финансовых структурах. Пока действовал чисто машинный вариант система давала множество ложных срабатываний. При этом, полностью выявлялись и реальные случаи хищений, но они были смешаны с неточными выводами. В результате за программу посадили ветеранов служб экономической безопасности в качестве операторов. За короткий срок они обучились работе с программой и, используя человеческий опыт, выбирали из всей совокупности сигналов лишь те, которые указывали на реальные хищения.

По этому поводу руководитель одной из самых перспективных компаний в области прогнозирования Quid, также принадлежащей П.Тилю Ш.Горли сказал: «Наибольший эффект Большие Данные дают тогда, когда возможности компьютеров в обработке гигантских массивов информации и выявлении нетривиальных связей соединены с человеческим опытом и профессиональной интуицией. А все, что вам рассказывает Р.Курцвейл про искусственный интеллект, это как минимум на ближайшее будущее просто красивые истории и PR ходы».

Подытоживая суть технологий Больших Данных, можно согласиться с краткой формулировкой консалтинговой компании Forrester: “Большие Данные объединяют техники и технологии, которые извлекают смысл из данных на экстремальном пределе практичности”.

Большие Данные в первую очередь были использованы в маркетинге, инвестиционном бизнесе, в продажах и т.п. Т.е. фактически там, где речь идет о косвенном, незаметном управлении поведением. Другой сферой применения Больших Данных стали процессы, описываемые множеством параметров, где за счет изменения режима можно получить экономию того или иного ресурса. В этой связи за пределами маркетинга и продаж самыми активными пользователями Больших Данных стали государственные учреждения и энергетический сектор экономики.

Но это лишь надводная часть айсберга. А подводная часть, как известно, всегда намного больше и, если можно так сказать, серьезнее. Подводной частью айсберга стало использование технологий Больших Данных в таких сферах как разведка и контрразведка, военное дело, геостратегия и то, что традиционно называлось информационными войнами, а фактически представляет собой форму жесткого когнитивного противоборства.

Большие Данные были быстро осознаны такими странами, как Соединенные Штаты, Великобритания и Япония, в качестве важнейшего ресурса стратегического значения. 29 марта 2012 года Администрация Б.Обамы выступила с инициативой «Big Data Research and Development Initiative» . Инициативой предусматриваются вложение значительных объемов ресурсов и проведение комплексных мероприятий в целях активного использования технологий Больших Данных на ключевых направлениях государственной политики США. В рамках инициативы в конце февраля этого года в Вашингтоне пройдет большая конференция «Big Data for government & defense».

В сентябре 2013 года правительство Японии опубликовало информацию о разработке национальной программы по Большим Данным. Летом минувшего года правительство Австралии заявило, что рассматривает Большие Данные как важнейший национальный стратегический ресурс и выдвинуло задачу стать головной страной в сфере использования технологий Больших Данных как на правительственном уровне, так и на всех других уровнях государственного аппарата в масштабах Британского Содружества Наций.

Большие Данные в сетевом измерении

Долгие десятилетия в основе политтехнологий, методов жесткого информационного противоборства, конструкторов для проведения государственных переворотов и революций лежала так называемая «теория толпы». Она была разработана усилиями Лебона, Тарда, Конетти, Московичи и проч. Эта теория базировалась на внешнем описании процессов. Как любая описательная теория она исходила частично из наблюдений, частично из картины мира самих исследователей. Тем не менее, теория так или иначе работала и построенные на ней методы давали определенный эффект. Едва ли не последним представителем школы «теории толпы» был Дж.Шарп с его книгой «От диктатуры к демократии». Однако сегодня с уверенностью можно сказать, что «теория толпы» описывает лишь небольшой фрагмент реальности и относится уже ко вчерашнему дню.

В последние годы создана, по сути, новая наука – социодинамика, которая обобщает эмпирические закономерности, полученные в результате применения технологий Больших Данных к огромным массивам информации, содержащейся в архивах крупнейших социальных платформ web 1 и web 2, таких как Google, Facebook, Twitter и т.п.

Эти эмпирические закономерности сегодня используются для отработки практического инструментария внешнего воздействия, управления и манипулирования социальными группами любых масштабов и любого уровня структурированности, а также для сборки и деструкции социальных субъектов. Именно применение Больших Данных к информации, полученной из социальных сетей, позволило осуществить прорыв в отработке инструментария внешнего социального управления поведением.

Как правило, зарубежные работы о Больших Данных можно поделить на две основных группы. Одни заполнены техническими подробностями архитектурных решений и интересны лишь профессионалам-айтишникам. Другие представляют собой набор красивых поучительных историй об эффективности применения Больших Данных для решения тех или иных задач, прежде всего, в бизнесе. Читать такие истории весьма занимательно, но с практической точки зрения абсолютно бесполезно. Поэтому мы постарались пойти третьим путем. Он заключается в изложении результатов наиболее интересных исследований социодинамики и соответственно описании тех самых, только что выявленных, эмпирических закономерностей, которые используются для разработки нового инструментария социального конструирования и разрушения.

Научная группа Facebook с привлечением специалистов из американских университетов, научных центров Европы и Азии провела исследование не только на материалах Facebook, но и ряда других крупнейших сетей. Было установлено, что внутри глобальной сети существуют более-менее устойчивые субсети, или как их называют на английском — паттерны.

Оказалось, что при всем многообразии этих паттернов, в конечном счете, они образуют восемь базовых структур. В основу типологии структур положена внутренняя конфигурация паттерна, плотность связей и структура внешнего взаимодействия паттерна с глобальной сетью или другими паттернами. Под внутренней конфигурацией понимают взаимоотношения внутри паттернов между людьми с различными социальными ролями. Оказалось, и возможно это самое главное, что в каждом из восьми базисных паттернов информация распространяется различным образом и с неодинаковой скоростью. Различаются также по этим паттернам взаимоотношения между онлайн и офлайн поведением. Фактически – это ключевое открытие. Оно позволяет заметно увеличить эффективность внешнего управления групповым и массовым сознанием и поведением.

К.Марлоу, руководитель научной команды Facebook отметил, что им, вместе с исследователями Северо-Западного университета в Чикаго удалось обнаружить, что все сложные сетевые системы, например, такие как интернет, социальные сети, электросети и даже колонии термитов имеют множество сходных черт, характеризующих как динамику, так и статику этих систем. Более того выяснилось, что во всех этих системах есть своего рода несущие узлы и элементы, которые образуют своего рода «скелет» сети, либо ее устойчивого паттерна. Собственно эти «скелеты» и определяют само существование сетей, паттернов. В значительной степени от них зависит жизненный цикл сети и ее устойчивость к внешним воздействиям.

Решающую роль в этой работе сыграл коллектив профессора А.Э.Барабаши. Еще в 2010 году А.Барабаши подключился к работам созданного на деньги Пентагона центра по исследованию социально-когнитивных сетей (Social Cognitive Network Academic Research Center – SCNARC). Там перед ним была поставлена задача практической проверки разработанных ранее теоретических моделей безмасштабных сетей на больших объемах реальных данных. Результатом работы А.Барабаши стала статья «Достижение социального консенсуса в результате влияния убежденного меньшинства». В работе говорилось, что при достижении в социуме пороговой границы примерно в 10% убежденных сторонников какой-либо идеи, возникает лавинообразный процесс завоевания этой идеей умов большинства членов социума. Начиная с 30% процесс становится необратимым. Но всего этого недостаточно. Нужно контролировать от 15 до 25 % драйверов сети. Отличие драйверов в том, что они не просто собирают информацию от разных людей и не просто являются источником информации для других участников сети. Их особенность в том, что они делают и то, и другое, выступая в роли коммуникаторов между группами людей и, как бы являясь информационными мостами, соединяющими изолированные островки микросообществ, из которых обычно состоит любая соцсеть. Поэтому настоящие драйверы — это не чемпионы Facebook по количеству друзей, и не чемпионы Twitter по количеству фолловеров. Это коммуникаторы, получающие информацию от одних групп людей и передающие ее другим группам. Принцип действует и в реале, и в виртуале.

Структура связей между драйверами сети в реале или в виртуале собственно и создает тот самый «скелет» сети, который выявили команды Facebook и Чикагского университета. Соответственно разрушение любой сети или сложного социального субъекта наступает не тогда, когда удается разрушить наиболее плотные связи внутри сети, а когда удается разрушить контакты между драйверами или «скелет» сети.

Исследователи из Северо-Западного университета в Чикаго в сотрудничестве с группой из Массачусетского Технологического Института, установили, что для того, чтобы взять сеть или ее устойчивые паттерны под контроль и осуществлять внешнее управление ими достаточно контролировать определенный процент участников сети или паттернов. Этот процент в зависимости от типа сетей и паттернов колеблется в интервале от 10 до 80%. Проценты прямо зависят от двух параметров – плотности связей внутри сети или паттернов и степени однородности элементов, входящих в сеть или паттерн. Жан Жак Слотин, профессор Массачусетского технологического института отметил в этой связи, что для сетей, где элементами являются люди, т.е. социальных сетей в онлайне и офлайне показатель контроля составляет от 9 до 15%. Практически это означает, что если контролируется информационный поток или поведение от 9 до 15% участников сети, то в значительной степени контролируется и вся сеть или паттерн. Это относится и к небольшим группам, и к социальным сетям максимального размера.

К. Марлоу в своих работах отмечает, что плотность социальных сетей гораздо выше, чем принято думать. Все хорошо знают правило шести рукопожатий. Оно гласит, что любые два человека в мире увязаны через цепочку из шести человек. Это правило растиражировано и в научной, и в популярной литературе, вошло в обиход. А между тем, базируется оно всего на нескольких экспериментах, проведенных в одном городе, а именно в Бостоне во второй половине 70-х годов. Команда Facebook, используя имеющиеся данные, проанализировала сведения на совокупности, составляющей 300 млн. пользователей сети в самых различных странах мира. Выяснилось, что для 98% пользователей Facebook действует правило не шести рукопожатий, а чуть меньше четырех.

К неожиданным результатам привело недавнее исследование под руководством члена научной группы Facebook Э. Бакши. Его осуществляли коллеги из университета штата Мичиган. Эксперимент назывался «Эхо-камера». Суть его состояла в том, что исследовались пути распространения мемов и факторы, влияющие на отношение пользователей Facebook к тем или иным лицам, событиям, процессам. Эксперимент проводился на совокупности 80 млн. аккаунтов. С одной стороны был получен весьма ожидаемый результат, что распространение мемов зависит от конфигурации паттернов, а между паттернами решающую роль играет массовость охвата мемом участников сети в целом. Гораздо более неожиданным оказался другой вывод. До эксперимента все были уверены, что на отношения участников паттерна решающее влияние оказывает позиция по этому вопросу других его членов, или как еще их называют «близких друзей». Выяснилось, что это не так. Слабые связи, т.е. позиция сети в целом или большого его фрагмента, куда входят несколько паттернов, оказывает большее влияние, чем позиция «близких друзей». Результат был настолько неожиданный, что эксперимент был трижды повторен и дал те же результаты. Не менее удивительным оказался тот факт, что мнение в виртуале может существенно расходиться с поведением в реале. Кроме того, оказалось, что в реале зачастую действуют несколько иные законы, чем в виртуале.

Присцилла Чан, жена Марка Цукерберга попросила его использовать возможности Facebook для увеличения добровольных бесплатных доноров крови в США. Цукерберг попросил научную группу предложить стратегию и практические инструменты реализации этой программы. При анализе результатов программы выяснилось, что при переходе из онлайна в офлайн ситуация меняется. Если на виртуальное мнение более сильное влияние оказывают слабые связи, то на реальное поведение больше воздействуют сильные связи. Фактически технология научной группы была построена на том, чтобы с одной стороны обеспечить максимально быстрое распространение мема «донор – это круто» по сети и создать этому мему климат максимального благоприятствования, а с другой стороны побудить наиболее влиятельных членов паттернов показать пример реальным поступком. Достигнуто это было путем отправления им персональных посланий за подписью Цукерберга, содержащим помимо просьбы не очень значащую, но приятную бесплатную «плюшку».

Недавно вышла публикация Центра Беркмана по изучению информации и общества при Гарвардском университете. Исследование проводилось на материале мониторинга веба и непосредственно полевых работ в Тунисе, Египте, Ливии, Йемене. Было выделено три аспекта влияния социальных сетей на политические процессы, прежде всего, в арабском мире, а именно – коммуникационный, мобилизационный и информационный. Исследователи из Гарварда сделали однозначный вывод о том, что мобилизационная роль социальных сетей в событиях в противовес мнению СМИ и блоггеров была весьма невелика. Различного рода виртуальные сообщества не придали сколько-нибудь массового характера выступлениям. Решающей технологией мобилизации стали пятничные молитвы и обращения мулл.

Коммуникационный фактор социальных сетей, безусловно, присутствовал. Более того, как было выявлено и по результатам мониторинга, и по результатам поля, он нарастал по мере развития событий. Т.е. на первом этапе коммуникация шла в основном вживую и через банальные телефоны, но дальше все чаще стали использоваться платформа Twitter и социальные сети.

Наиболее заметную роль социальные сети сыграли в части информационного освещения событий в арабском мире и во всемирном медийном пространстве. Результаты исследования убедительно показали, что сообщения в Twitter и социальных сетях оставляла ничтожно малая часть участников событий. В их число входили, прежде всего, агитаторы, или ангажированные блоггеры. Кроме того, среди них было немало и тех, кто писал то, что думал, или выкладывал видео, которые реально снимал. При этом именно эти сообщения в значительной степени использовались мировыми онлайн СМИ всех форматов и формировали информационные потоки. Частично здесь имел место фактор целенаправленного использования фрагментарной информации в целях манипулирования общественным мнением. Но главным, по мнению исследователей из Гарварда, было то, что именно такая технология формирования новостей встроена в производственные процессы мировых интернет и офлайн СМИ. Т.е. так произошло не только потому, что кто-то целенаправленно занимался манипуляциями, но и потому, что это соответствовало отработанным технологиям подачи новостей в режиме нон-стоп.

Широко обсуждаются результаты промежуточных исследований Института анализа социальных и политических конфликтов Джорджтаунского университета. Этот Университет является одной из ведущих «фабрик мысли» обслуживающих, прежде всего, Госдепартамент и Совет национальной безопасности. Институт вот уже девять лет ведет тему «Квазитолпа в политических событиях».

Еще в прошлом веке Г.Лебон написал свою знаменитую работу о толпе. В ней сформулировано и классическое понимание толпы, как большого, в каком-то смысле даже избыточного количества людей, оказавшегося в определенное время в конкретном месте. Квазитолпа отличается от толпы тем, что представляет собой толпу, которая собралась не случайно из-за стечения тех или иных обстоятельств, либо объективных процессов, а была собрана сознательно, либо собралась в результате каких-то общественных процессов.

Уникальность этого исследования состоит в том, что феномен квазитолпы изучался не только на материале арабского мира, но и Западной Европы, конкретно, событий в Лондоне, Париже, Берлине в последние годы, США («Оккупай Уолл-Стрит»). В результате исследований, которые велись с привлечением специалистов из МТИ и Северо-Западного института, выяснились очень интересные вещи. Для каждой из стран имеется свой критический порог численного состава квазитолпы, когда она начинает играть активную роль в политических, социальных и экономических процессах. Этот порог зависит от численности населения в ключевых городах, культурных особенностей, национального темперамента и компьютерной вооруженности населения.

В исследовании установлено, что квазитолпа превращается в своего рода устойчивый субъект действия, способный собираться с определенной периодичностью при выполнении условий, связанных с ее структурным составом. Конкретно речь идет о следующем. Выяснилось, что в квазитолпе четко выделяются три группы участников. В целом квазитолпа понимается не как простое огромное количество людей, а как единое целое, состоящее из людей и групп, объединенных слабыми и очень слабыми связями.

Так вот, если в квазитолпе не менее 7-15% людей принадлежат к группам, внутри которых имеются сильные связи, то это необходимый но недостаточный фактор превращения квазитолпы в реальный фактор действия. Что это за группы? Это не организаторы квазитолпы, а люди, которые влились в нее не поодиночке, а группами, которые тесно взаимодействуют в реале и общаются в виртуале. Эти группы становятся центрами притяжения и стабилизации квазитолпы. Они же в значительной степени втягивают в себя понемногу остальных членов квазитолпы. Про эти группы было известно и раньше.

А вот третий компонент квазитолпы четко выделен впервые. Выяснилось, что в квазитолпе, которой удалось стать субъектом действия, обязательно присутствовали микрогруппы, выполняющие роль катализаторов. Их численность должна составлять от 2 до 5% от общего числа участников квазитолпы. Это люди, которые наиболее активно ведут себя в квазитолпе, а также оказываются первыми при любых конфликтах и столкновениях. Было бы упрощением, как показали результаты исследований, всех их без исключения относить к провокаторам. Конечно, провокаторы в ряде случаев составляют большинство этой группы, но немалая часть людей, попавших в указанную категорию – это участники квазитолпы, которые по своим личностным и социально-психологическим характеристикам, культурным стереотипам и возрастным особенностям склонны к импульсивным действиям, имеют низкий порог сдерживания страхом и т.п. Исследованиям этой категории в России длительное время в России с успехом занимается д.ф.н. И.Сундиев. Очень интересно, что согласно анализу Института, эта группа в значительной степени формируется и рекрутируется в социальных сетях. По численности, они ничтожны, но последствия их деятельности очень велики. И это не удивительно, поскольку динамика квазитолпы – это чисто синергетический процесс. При таких процессах даже малые изменения могут привести к очень большим последствиям.

Имеется много свидетельств, что для того, чтобы квазитолпа превратилась в субъект действия, одних процессов самоорганизации недостаточно. Они необходимы, но только самоорганизации мало. Должно присутствовать внешнее управление со стороны тех, кто сам ни в коем случае не участвует в квазитолпе, а обеспечивает своего рода логистику, финансирование и т.п. Проще говоря, каждому кукольному театру нужен свой Карабас-Барабас. Хотя в реальности обычно действует не индивидуальный, а коллективный Карабас.

Значительный интерес вызвала недавняя работа Парижского центра изучения социальных, этнических и межконфессиональных конфликтов о взаимоотношениях виртуальных и реальных социальных сетей и групп в конфликтных ситуациях. Исследование имело целью выяснить вопрос, какие именно виртуальные группы быстрее всего самоорганизуются в конфликтных ситуациях и способны к согласованным действиям. В качестве материалов были использованы данные по беспорядкам в Париже, событиям прошлого года в Тунисе, футбольным беспорядкам в центральной Германии. Было выделено три типа групп: полностью виртуальные группы, которые до событий не имели между собой никаких контактов в реале, смешанные группы, где часть людей взаимодействовала в реале и все взаимодействовали в социальных сетях и, наконец, реальные группы, все члены которых многократно пересекались и взаимодействовали в реальном мире.

Страницы: 1 2 3

Что такое синергетика?	Экономика, кризисы, риски, безопасность, самоорганизация	Математические методы в синергетике
Синергетика и образование	Сети, когнитивная наука, управление сложностью	Синергетика и эволюционизм
Синергетика и искусство	Биология, психология, медицина, демография и социология	Философия и синергетика
Будущее России	Синергетика и научное прогнозирование	Цифровая экономика, цифровые экосистемы
Журнал "В мире науки"	Видеоматериалы	Конференции

«Большие данные» Елена Ларина, Владимир Овчинский

«Большие данные»
Елена Ларина, Владимир Овчинский