Russian
| English
"Куда идет мир? Каково будущее науки? Как "объять необъятное", получая образование - высшее, среднее, начальное? Как преодолеть "пропасть двух культур" - естественнонаучной и гуманитарной? Как создать и вырастить научную школу? Какова структура нашего познания? Как управлять риском? Можно ли с единой точки зрения взглянуть на проблемы математики и экономики, физики и психологии, компьютерных наук и географии, техники и философии?"

«Компьютерная аналитика» 
Ю.А. Семенов

Аналитика существует давно и имеет целью выявление тенденций и прогнозирование. Часто служит для подтверждения уже выбранного курса или принятого решения.

Компьютерная аналитика (когнитивный компьютинг) имеет целью выявление неизвестных тенденций, закономерностей и корреляций. Современная компьютерная аналитика способна воспринимать задания на естественном языке (например, русском). Эта технология позволяет получить объективный прогноз и выявить трудно предсказуемые последствия тех или иных решений.

На данном этапе востребована аналитика для бизнеса, которая позволяет прогнозировать динамику спроса производства и изменение цен. Но в перспективе, в частности по мере развития Интернета вещей, можно ожидать использования технологии для выявления неизвестных связей и зависимостей. Компания IBM считает возможным использование аналитики для выявления неизвестных зависимостей и в сфере науки (путем анализа побочных результатов измерений).

В 2015 году объем накопленных человечеством данных достиг 7 зеттабайт (1 зеттабайт =1021 байт эквивалентен объему 50 библиотек конгресса США). Заметная доля этих данных доступна через Интернет (по большей части в виде текстов). Но до недавнего времени люди не могли извлекать пользу из этой информации.

22-го сентября 2011 г. появилась заметка компании IBM о компьютере Watson (см. Talking computer will change the world; promises not to kill you). Разработчики (во главе с David’ом Ferrucci) позиционируют Watson, как компьютерную систему искусственного интеллекта. Watson может обрабатывать до миллиона книг в сек. (500 гигабайт). Этот компьютер содержит в себе 90 серверов Power7 750, каждый из которых имеет по 4 восьмиядерных процессора Power7. Оперативная память этой машины содержит 15 Тбайт.

Данный проект можно считать шагом на пути создания искусственного интеллекта к 2023 году (см.  http://book.itep.ru/4/7/resources.htm#20) Трудно утверждать это точно, но возможно, что этот проект является этапом создания искусственного интеллекта для безлюдного оружия поля боя. Компания IBM в прошлом году открыла WATSON для широкого международного сотрудничества.

Хотя компьютер Watson лишь с некоторой натяжкой может быть отнесен к суперкомпьютерам (143-е место в списке Top500 на начало июня 2013), он занимает особую позицию. Это первый компьютер, который может работать с текстами на естественном языке и в нем реализован важный шаг в обучении машины пониманию контекста и самого задания. Что важно, машина способна пользоваться данными из Интернет для решения стоящих перед ней задач.

Компания IBM пытается коммерциализовать использование вычислительной машины Watson (победитель телевизионного шоу Jeopardy). Среди возможных применений рассматривается сложная диагностика различных заболеваний, в частности раковых (что подтверждено на практике). С точки зрения программирования эта машина не является детерминистской, она управляется запросами, анализирует накопленную информацию и возвращает данные, которые с ее точки зрения являются наиболее релевантными полученному запросу. Машина может также использоваться как советчик для врача. («Interview: Using IBM Watson for smart decisions», Dan Cerruti, 26 марта 2013).

Компания IBM предлагает свой суперкомпьютер Watson в качестве платформы для разработки облачных приложений, ориентированных на когнитивный компьютинг (см. «IBM to offer Watson supercomputer as cloud development platform«, Chris Kanaracus, IDG News Service, November 14, 2013). Объемы информации во всех областях быстро растут.

Компания IBM усовершенствовала программу анализа данных Watson Discovery Advisor так, что она стала способна ответить на ваши вопросы, до того, когда вы их задали (см. «IBM Watson now answers your questions before you ask«, PCWorld). Считается, что эта программа будет полезной помимо медицины в финансах и юридической деятельности. Можно также считать, что эта система не запрограммирована, а обучена. Компания IBM на компьютерной бизнес аналитике заработала в 2014 году более 50 млн. долларов.

Информация о здоровье, которую собирает Apple Watch, может передаваться в облако на базе IBM’s Watson (см. «IBM’s Watson Health division will incorporate patient data from Apple«, Fred O’Connor, IDG News Service, April 13, 2015). Медицинские данные очень неоднородны, большая часть информации имеет текстовый вид. Для обеспечения согласование взаимодействия различных систем налажено сотрудничество между Apple, Johnson & Johnson, Medtronic и Watson Health Cloud. Разрабатываются программы аналитики для реализации индивидуальных планов лечения.

Вслед за Watson появились машины Siri, Cortana и пр. того же класса и назначения.

Если в 2013 году на пике популярности были научные аналитики, в 2014 центр сместился в область информационной бизнес-аналитики (см. «Big Data Analytics predictions for 2014«, Michele Chambers, Greg Todd, David Smith, December 31, 2013). За счет программных средств прогнозирование будет осуществляться в реальном масштабе времени. Научным аналитикам останутся стратегические инициативы. Большое внимание будет уделено подготовке молодого поколения научных аналитиков. В 2014 году предсказательная аналитика начала работать в рамках Hadoop. В 2014 маркетинговая аналитика на основе big data стала реальностью. Смотри также http://blog.revolutionanalytics.com/2013/12/14-analytics-predictions-for-2014.html. В этой области шире будет применяться технология NoSQL.

Директор подразделения по цифровой преступности компании Microsoft Брайан Херт (Bryan Hurd) утверждает, что аналитика big data начинает играть все большую роль в борьбе с киберпреступностью (см.»Big data analytics key to crime fighting, says Microsoft«, Warwick Ashford). Аналитика позволяет выявлять активность, сопряженную с использованием активационных ключей украденных программ. Анализ сетевого трафика способен предсказать будущие кибер преступления.

В LANL (Lawrence Livermore National Laboratory) создан суперкомпьютер (Catalyst), предназначенный для переработки больших объемов данных (см. «Need to crunch 150 teraflops per second? Meet first-of-a-kind supercomputer Catalyst«, Darlene Storm, May 07, 2014). Данный комплекс планируется использовать для бизнес аналитики и для исследования свойств сверхтяжелых элементов, в частности с атомным номером 117.

Многие задачи, например, бизнес не требуют обработки гигантских объемов данных и для таких целей IBM разработала машины размером с коробку для пиццы.

Исследовательская компания Gartner выделяет 10 технологических тенденций в 2015 году (см. «Сloud, web-scale IT and IoT in Gartner’s 2015 top technologies«, Archana Venkatraman, Thursday 09 October 2014). Среди них облачные технологии, архитектуры SDN, 3D-печать, Интернет вещей (IoT), информационная аналитика и WEB-технологии. Смотри также «Gartner lays out its top 10 tech trends for 2015«, Patrick Thibodeau, Computerworld, Oct 7, 2014.

Компании IBM и Juniper Networks решили объединить возможности своего оборудования и программного обеспечения для извлечения аналитических данные из информации проходящей через сетевые каналы (см. «IBM, Juniper to offer joint network analytics«, Antone Gonsalves, 26 Feb 2015). Речь идет о данных, поступающих от персональных компьютеров и мобильных устройств. Технология IBM будет встроена в шлюзы Juniper, в то время как более глубокая аналитика будет реализована на отдельных серверах.

В новую версию Microsoft Office встроено средство (BeyondCore Apps) для реализации аналитики (см. «New Office tool brings analytics for everyone«, Rob Enderle, April 6, 2015). Это аналитическое средство могут использовать не только эксперты, но практически все пользователи Office. Для использования этого продукта достаточно навыков применения Office. Ожидается, что это средство будет и дальше совершенствоваться в течение ближайших 5-10 лет.

Аналитика больших объемов данных находит все более широкое приложение. Ниже приведены доли этой технологии в программных разработках разных отраслей ИТ: (см. «How, where and why big data analytics are delivering value«, David Loshin, June 2015).

  • 31% в сфере торговли
  • в анализе больших объемов данных
  • 30% в мобильных приложениях
  • 30% при интеграции данных
  • 26% в автоматизации или управлении бизнес-процессами

Современные системы аналитики могут предсказать кражу данных путем сканирования сообщений e-mail (см. «Artificial intelligence system can predict data theft by scanning email«, Tim Hornyak, IDG News Service, Oct 2, 2014). Токийская фирма UBIC создала программу, которая анализирует тексты почтовых сообщений и выявляет потенциальные угрозы кражи данных

Исследовательская лаборатория армии США (ARL, министерство обороны США) планирует использовать в своих разработках в 2015-30гг суперкомпьютер с вычислительной мощностью 100 петафлопс (см. «U.S. Army plans for a 100 petaflop supercomputer«, Andy Patrizio, February 25, 2015). Компьютер будет применен и для информационной аналитики. В будущем это направление разработок будет являться стратегическим.