Ценность ваших данных бесплатное чтение
Литературный редактор В. Доценко
Руководитель проекта А. Туровская
Дизайн обложки Е. Алёнушкина
Дизайн блока Т. Саркисян
Корректоры Н. Ерохина, Н. Казакова
Компьютерная верстка Б. Руссо
© С. Кузнецов, А. Константинов, Н. Скворцов, 2022
© Оформление. ООО «Альпина ПРО», 2022
Все права защищены. Данная электронная книга предназначена исключительно для частного использования в личных (некоммерческих) целях. Электронная книга, ее части, фрагменты и элементы, включая текст, изображения и иное, не подлежат копированию и любому другому использованию без разрешения правообладателя. В частности, запрещено такое использование, в результате которого электронная книга, ее часть, фрагмент или элемент станут доступными ограниченному или неопределенному кругу лиц, в том числе посредством сети интернет, независимо от того, будет предоставляться доступ за плату или безвозмездно.
Копирование, воспроизведение и иное использование электронной книги, ее частей, фрагментов и элементов, выходящее за пределы частного использования в личных (некоммерческих) целях, без согласия правообладателя является незаконным и влечет уголовную, административную и гражданскую ответственность.
Когда шла работа над книгой «Ценность ваших данных», одному из авторов случилось оказаться в экстремальной ситуации. И та выявила все действительно важные для человека качества и ценности, но в особенности продемонстрировала ЦЕННОСТЬ ВАШИХ ДРУЗЕЙ и СЕМЬИ. Именно ДРУЗЬЯМ и СЕМЬЯМ мы и хотели бы посвятить эту книгу.
Сергей Кузнецов, Александр Константинов, Николай Скворцов
Предисловие
В XXI веке много говорят о данных: эксперты спорят, стоит ли уделять правильной организации работы с ними столь много внимания или все это хайп и надумано. Авторы этой книги уже более 20 лет наблюдают за развитием различных технологий, за тем, как рождаются методологии работы с данными, в компаниях появляются специалисты по этому направлению.
Мы постарались собрать воедино исторические, организационно-методические и технологические аспекты данных, раскрыть для читателя многообразие терминов и аббревиатур. Также вас ждет рассказ о существующем инструментарии работы с данными и о трендах, которые мы наблюдаем сегодня и увидим завтра. Все это – на языке, доступном людям без специального ИТ-образования.
Мы долго шли к решению о написании этой книги, и, как бы ни откладывали это решение, наша жизнь и работа все время подводили к необходимости описания данных, которые буквально пронизывают нашу жизнь. Для нас же ситуация получилась и вовсе уникальной, потому что мы, как профессионалы в этой области, находимся, если можно так выразиться, по обе стороны проникновения данных в жизнь общества. Именно поэтому мы все-таки решились погрузиться с головой в эту работу, которая стала, неожиданно для нас, возможностью всесторонне систематизировать не только опыт и знания, но и отраслевые компетенции заказчиков и партнеров.
Еще одним важным фактором, побудившим написать книгу, стала полуторагодичная работа нашего коллектива над переводом и научной редактурой второго издания легендарной книги «DAMA-DMBOK: Свод знаний по управлению данными». Результаты этой работы по достоинству оценены российскими читателями, которым книга позволила получить новые и систематизировать уже имеющиеся знания, а также стать частью международного сообщества и даже целой индустрии работы с данными, говорить с ним на языке единых терминов и подходов к процессам работы с данными.
Важно отметить, что создание книги – это процесс, напрямую связанный с импортозамещением программных продуктов, когда на смену зарубежному софту приходят российские разработки. И этот процесс стал гораздо важнее в условиях санкций против России. Период с конца февраля 2022 года стал крайне тяжелым для отечественных компаний, закупивших зарубежный софт. Особенно болезненным было «расставание» с иностранными организациями, которые в течение долгих лет поставляли нам продукты в области управления данными.
Такие компании, как IBM, SAP, Oracle, объявили об уходе из России, т. е. продаж, а главное, поддержки, выполнения проектов и много другого больше не будет. Конечно, в такой ситуации все большее количество организаций начинает принимать активные меры по импортозамещению. Это движение существовало и раньше, просто сейчас, в силу понятных причин, оно ускорилось. Во многом предвидя такую ситуацию, мы постарались учесть опыт применения российского программного обеспечения в области управления данными. Уверены, наша книга будет способствовать расширению круга отечественных литературных источников по тематике управления данными и тем самым сыграет значимую роль в ускорении всех процессов, связанных с заменой иностранных программных продуктов на отечественные.
И конечно, стоит представить уважаемым читателям одного из главных героев книги. Начиная со второй ее части, мы вводим в повествование некую абстрактную корпорацию «Телеком Дубль». Это необходимо для большей связи с реальностью, с проектами внедрения, опыт в которых у коллектива авторов суммарно более семи лет. Именно с помощью «Телеком Дубль» мы будем приводить конкретные примеры, чтобы читателям было удобнее визуализировать те понятия, концепции и инструменты, о которых будет идти речь на страницах книги. Название у компании абстрактное, она нужна нам лишь для примера увеличения эффективности ее работы при внедрении различных практик в области управления данными. Соответственно, любые сходства с реальными компаниями случайны. В начале повествования компания не обладает какими-то серьезными знаниями в области управления данными. Она ведет свою деятельность на рынке телекоммуникаций, ее клиентами являются как частные лица, так и компании. Она имеет сложную филиальную организационную структуру, информационные системы, отвечающие за различные функции, включая фронт- и бэк-офисы. Особых успехов нет. Но с каждой новой главой ситуация будет меняться! В каждой главе мы будем описывать, как рассматриваемая проблематика выглядит на примере «Телеком Дубль», что для нее значит внедрение того или иного инструмента, что получается в результате как для ИТ-ландшафта, так и с организационной и эксплуатационной точки зрения.
Ценность ваших данных… Эти три слова описывают книгу целиком. Данные, информация, знания – все эти понятия окружают нас каждый день. Но ценность данных нужно еще раскрыть с помощью грамотного управления: без этого они могут быть лишь балластом, тянущим на дно.
При обсуждении процессов управления данными часто рассматривают две цепочки – цепочку ценности данных и цепочку поставок данных. Эти обобщенные концепции настолько важны, что мы решили отразить их на обложке. Что это за цепочки, как они соотносятся друг с другом и как выстроить их таким образом, чтобы извлечь из данных максимальную ценность? Об этом мы тоже поговорим на страницах предлагаемой книги.
Надеемся, что наша работа будет интересна самому широкому кругу читателей, которые интересуются данными. А учитывая тот факт, что данные в последние годы окутывают нас все больше и больше, круг будет расширяться.
Книга состоит из двух частей.
В первой части описывается многообразие окружающих нас данных и связанных с ними технологий, рассматривается последовательность преобразований «данные – информация – знания – мудрость», обсуждаются эволюция отношения к данным в организациях и задачи, стоящие перед ними в связи с переходом к представлению о данных как ценнейшем стратегическом активе.
Во второй части анализируются особенности данных как объекта управления, описываются функции управления информационными активами в контексте построения цепочек ценности данных и цепочек их поставок, обсуждаются основные тренды будущего в области технологий управления данными.
Введение
В 2006 году британский математик и бизнесмен Клайв Хамби ввел в обращение фразу «Данные – это новая нефть»[1]. Он произнес ее на саммите топ-менеджеров по маркетингу, который проводился американской Ассоциацией национальных рекламодателей (Association of National Advertisers, ANA) в Школе менеджмента им. Келлога (Kellogg School of Management).
В том же году вице-президент ANA Майкл Палмер (Michael Palmer) в статье, посвященной тезису Хамби, развил его мысль: «Данные похожи на сырье. Оно полезно, но в необработанном виде непригодно для использования. Его необходимо преобразовать в газ, пластмассу, химикаты и тому подобные вещи, чтобы создать имеющие ценность объекты, которые обеспечили бы деятельность, приносящую прибыль; аналогичным образом и данные должны быть разложены на элементы и проанализированы, чтобы они обрели ценность»[2].
Спустя несколько лет, в 2013 году, глава IBM Вирджиния Рометти (Virginia Rometty), выступая перед представителями американского Совета по международным отношениям (Council on Foreign Relations, CFR), несколько перефразировала эту мысль, сравнив с новой нефтью большие данные (Big Data)[3].
Сравнение данных с нефтью стало использоваться еще активнее после появления в 2017 году в журнале The Economist статьи «Самый ценный ресурс в мире больше не нефть, а данные»[4].
Наконец, не менее ярко высказался авторитетный китайский ученый и эксперт Кай-Фу Ли (Kai-Fu Lee)[5]. В своей книге «Сверхдержавы искусственного интеллекта. Китай, Кремниевая долина и новый мировой порядок», вышедшей в 2019 году, он пишет: «Если данные – это новая нефть, то Китай – это новая Саудовская Аравия»[6].
Но одновременно с ростом количества упоминаний о данных как о новой нефти возрастало и число публикаций, выдвигающих обратный тезис: «Данные – это не новая нефть»[7]. В последнее время стали появляться статьи, рассматривающие вопросы токсичности данных[8] и даже высказывающие мнение, что данные – это «новый мусор», не имеющий особой ценности[9].
Очевидно, ключ к разрешению противоречия – приведенные выше слова вице-президента ANA Майкла Палмера о том, что данные похожи на сырье и для того, чтобы они обрели ценность, необходима их предварительная обработка. Но следует учитывать, что это особое сырье, во многом отличающееся от нефти и других природных ресурсов. Так как же правильно организовать его обработку? Существуют ли рациональные методы работы с данными? Ответы на эти вопросы – в соответствующем отношении к данным как отдельных компаний и организаций, так и целых государств.
Последние 10–15 лет в среде специалистов, занимающихся вопросами работы с данными, последовательно формируется представление об управлении данными как активом[10]. Созданы профессиональные организации, развивающие это направление. В частности, функционирует Международная ассоциация управления данными (Data Management Association International, DAMA), объединившая профессионалов в области управления данными по всему миру. Она призвана собирать, систематизировать и пропагандировать прогрессивный опыт. Регулярно проводятся различные тематические форумы, появилось большое количество книг и статей на эту тему, включая вышедшее в 2017 году (и переведенное на русский язык) уже второе издание руководства DAMA к своду знаний по управлению данными (DAMA-DMBOK2)[11]
Что же нужно делать компании или организации, чтобы начать обращаться с данными как с активом? Базовые шаги, позволяющие обеспечивать и наращивать монетизацию данных, известны. Они изложены, например, в книге ведущего аналитика Gartner Дагласа Лейни[12] «Инфономика: информация как актив: монетизация, оценка, управление»[13]. Тем не менее в этой же книге подчеркивается, что в большинстве организаций не введена практика последовательного управления информационными активами, как это сделано в отношении материальных или финансовых активов. Сотрудники компаний продолжают действовать по старинке. В частности, сохраняется несогласованность между управлением информационными технологиями и управлением данными. В своей переписке с Лейни Джон Лэдли[14] отмечал: «Пока мне приходится наблюдать, как команды разработчиков поспешно производят сотни приложений и сервисов, не принимая во внимание вопросов использования связанных с ними данных, мне будет обеспечена полная занятость».
Недооценка перехода на новые подходы к работе с данными рискованна. В 2016 году Клаус Шваб (Klaus Schwab), основатель и президент Всемирного экономического форума в Давосе, в своей одноименной книге провозгласил четвертую промышленную революцию. Революцию, которая основана на цифровизации и характеризуется дизруптивным (ломающим привычные представления)[15] воздействием на утвердившиеся традиционные компании. Чтобы удержаться на плаву, компании вынуждены трансформировать себя, используя для этого цифровые и информационные технологии (рис. В1). Шваб подчеркивает, что особую тревогу в связи с осуществлением стоящих на повестке дня революционных преобразований у него вызывают два фактора, ограничивающие их позитивный потенциал. Первый – низкий уровень управления текущими изменениями. Второй – отсутствие единой последовательной концепции их осуществления. Оба фактора распространяются и на вопросы работы с данными.
Четвертая промышленная революция основана на цифровизации и характеризуется дизруптивным (ломающим привычные представления) воздействием на утвердившиеся традиционные компании.
Чтобы оставаться на плаву, компании вынуждены трансформ ироваться, используя для этого цифровые технологии, – проводить цифровую трансформацию.
Компания изобретает заново саму себя, директор по цифровой трансформации (CDTO) выступает в роли «внутреннего предпринимателя».
Некоторые ключевые этапы развития представлений о ценности данных и цифровой трансформации начиная с начала 2000-х отражены на рисунке В2.
Появившийся во время первой президентской кампании Билла Клинтона в 1992 году популярный слоган «Это экономика, тупица» (It’s the economy, stupid), подчеркивающий важность и сложность решения экономических проблем, с тех пор трансформировался применительно ко многим контекстам. В частности, в контексте цифровизации широко распространилось клише «Это данные, тупица» (It’s the data, stupid)[16]. А чтобы привлечь еще большее внимание к необходимости комплексного учета всех аспектов работы с данными и управления ими, стала использоваться фраза «Это не просто данные, тупица» (It’s not just the data, stupid)[17]. Важность всестороннего взгляда на данные убедительно подтверждает практика реализации проектов, связанных с уберизацией (uberization), внедрением концепции «умного города» (smart city) и другими проявлениями того, что называется цифровой экономикой (digital economy) или экономикой, управляемой на основе данных (data-driven economy).
Как наладить управление данными, чтобы достойно противостоять дизруптивным воздействиям, извлечь ценность из имеющихся информационных ресурсов (превратить их из «мусора» в «нефть») и неуклонно ее повышать? Разобраться в этих вопросах руководителям и рядовым сотрудникам предприятий и организаций, не имеющим прямого отношения к сфере ИТ, порой бывает непросто. Да и у специалистов в области ИТ, как показывает наш опыт, возникает немало вопросов.
К сожалению, литературы на русском языке на эту тему еще очень мало, а информация из многочисленных иностранных источников не всегда доступна, в том числе из-за языкового барьера. Хорошо осознавая эти проблемы, мы решили поделиться собственным накопленным опытом и видением ситуации. Надеемся также, что наша книга дополнит набор русскоязычных материалов, используемых преподавателями и обучающимися по такому недавно возникшему и стремительно развивающемуся образовательному направлению, как data literacy (грамотность в области данных).
Часть 1. Данные: Смена парадигм
От первой научной революции до четвертой промышленной
Глава 1. Цифровое многообразие
1.1. В чем ценность данных
Стоит только задуматься, в каком мире мы живем, и сразу обнаруживаешь, какое количество технологий нас окружает. Сейчас мы уже не представляем себе жизни без них. Мало кто задумывается, что с каждым годом динамика формирования наших потребностей во всем новом растет невероятными темпами. Даже такие крайне необходимые и уже привычные вещи, как мобильный телефон, еще 30 лет назад вызывали восхищение. Тогда пользоваться ими могли лишь избранные, сейчас же этот девайс стал постоянным спутником современного человека и уже не воспринимается как мобильное средство голосовой коммуникации. iPhone первого поколения, разработанный корпорацией Apple, поступил в продажу в 2007 году и перевернул представление о мобильном телефоне, сделав его центром коммуникаций, развлечений, устройством для получения всевозможных электронных услуг и средством платежей. Функциональные возможности современных телефонов становятся все шире. И сейчас, по прошествии 15 лет, мы себе уже не представляем, как можно жить без всего этого.
Таких примеров сотни тысяч – в самых разных областях нашей жизни. Все они стали настолько повседневными примерами нашего общения с технологиями, что мы к ним привыкли и перестали замечать.
Но несмотря на эту кажущуюся повседневность современных технологий, мировая экономика очень чутко реагирует на происходящие в нашей жизни изменения. Эта реакция проявляется повышенным интересом инвесторов в сторону технологического сегмента, который позволяет на основе человеческого интеллекта, предпринимательской смелости и современных процессов управления создавать крупнейшие мировые компании, каждая из которых может в любой момент обогнать, казалось бы, незыблемые столпы мировой экономики.
Давайте взглянем на рейтинг 100 крупнейших компаний мира (табл. 1.1)[18]:
Обращает на себя внимание количество технологических компаний в первой десятке. Если быть точными, их пять, а в первой сотне – уже 30. Помимо этого, в рейтинге еще 19 компаний, занимающихся здоровьем и биотехнологиями, что также относится к технологическому сегменту деятельности. По прогнозам аналитиков, количество высокотехнологических компаний будет возрастать еще большими темпами, а одним из основных критериев успешности для компаний из других областей станет использование высоких технологий в развитии своих решений.
Экономическая важность высокотехнологических компаний уже сейчас оказывается основополагающей для развития мировой и национальных экономик. Из 20 крупнейших компаний мира 10 (Apple, Alphabet, Amazon, Microsoft, Alibaba, Walmart, Tencent, Johnson & Johnson, Procter & Gamble, Nestlé), по мнению Boston Consulting Group, являются самыми инновационными на планете (рис. 1.1)[19]. Вывод прост: сегодня, чтобы стать успешной компанией, необходимо быть инновационной и высокотехнологичной независимо от отрасли деятельности. Именно это становится фундаментом для развития.
При всем многообразии высоких технологий в различных областях нашей жизни есть несколько ключевых технологий, на которых исследователи и разработчики строят свои открытия. Одной из групп таких технологий являются решения для работы с данными, которые не только помогают в создании новых продуктов, но и позволяют повысить эффективность действующих решений.
Одним из самых ценных активов компаний в ближайшем будущем станут данные, накопленные ими за годы деятельности: информация о клиентах, поставщиках, номенклатуре закупаемой и продаваемой продукции, о сотрудниках, оборудовании, исследовании рынков, а также статистика, публикуемая различными государственными, общественными и частными организациями. Возможность анализировать и использовать огромные массивы данных позволит государствам и организациям стать более эффективными – создать огромное количество новых направлений деятельности и совсем по-иному взглянуть на давно сложившиеся стороны жизни.
В последнее время появляется все больше и больше исследований, описывающих человека как огромный массив информации, связанной с его документами, услугами, которыми он пользуется, аккаунтами в социальных сетях, транзакциями, платежными инструментами и другими цифровыми следами повседневной жизни. Еще 100 лет назад человека, его внешность, знания, устремления, жизненный опыт, чувства, таланты, эмоции и желания изображали художники и литераторы, сейчас же цифровые следы человека заметны везде.
Как мы уже говорили, мы живем в эпоху технологий и открытий, происходящих с немыслимой скоростью, когда с момента фундаментальных открытий до повседневности технологий проходят считанные годы, а объем хранимых человечеством данных прирастает ежегодно десятками процентов. Согласно результатам исследования аналитической фирмы IDC, опубликованным в докладе «Эра данных – 2025» (Data Age 2025), в ближайшие годы основной объем данных будут производить не отдельные пользователи, а организации. На промышленность и другие сферы экономики придется до 60 % всех данных мира. Для сравнения, в 2015 году предприятия генерировали треть всех мировых данных. При этом, как утверждают авторы исследования, в будущем более важную роль будет играть качество данных, а не их количество. «Не все данные одинаково важны, а без контекста они и вовсе бесполезны. В этот период перемен лидерство будет принадлежать организациям, которые сумеют определить наиболее критичные подгруппы информации с максимальным влиянием на нужную сферу деятельности и сосредоточатся именно на них» – говорится в отчете. Пятая часть всех данных к 2025 году станет критически важной, считают исследователи. Речь идет о сведениях, от которых будет зависеть жизнь и безопасность людей, международная обстановка и мир на планете.
При этом в ближайшие годы разрыв между объемом данных, нуждающихся в защите, и реально защищенной информацией будет только расти. К 2025 году до 90 % всей информации должно быть так или иначе защищено. Авторы доклада также отмечают, что значительный объем данных будет исходить от устройств, которые окружают нас каждый день. Во-первых, к 2025 году 75 % всего населения Земли будет иметь постоянный доступ в интернет. Во-вторых, многократно возрастет количество умных гаджетов и домашних роботов, которые будут производить так называемые метаданные – служебную информацию, которой машины будут обмениваться между собой для слаженной работы. По сравнению с сегодняшним днем каждый человек будет в 20 раз чаще взаимодействовать с интернетом или с устройствами с выходом в интернет. Если сейчас среднее количество взаимодействий чуть больше 600, то к 2025 году мы будет сталкиваться с сетью 4800 раз в день[20].
Работа тысяч корпораций и государственных структур по созданию различного рода сервисов, предоставляющих услуги посредством интернета, уже привела к тому, что в крупных городах люди зачастую получают существенную долю государственных сервисов и приобретают различные товары и услуги за пару минут, пользуясь приложениями в телефоне. Более того, зачастую мы сталкиваемся с тем, что компании знают о наших предпочтениях и предпочтениях членов наших семей гораздо больше, чем мы сами, напоминая нам о том, какие продукты мы предпочитаем, когда необходимо запланировать очередную покупку и доставку этих продуктов к нам домой, когда необходимо сделать очередное ТО автомобиля, когда заканчиваются страховки и какие страховые продукты мы предпочли в прошлом периоде.
Все это, с одной стороны, делает жизнь легче и позволяет сосредоточиться на самом важном – семье, работе, хобби, общении с друзьями и родственниками, с другой стороны, еще больше ускоряет темп нашей жизни. Если вдуматься, мы экономим огромное количество времени на дороге, очереди, ожидании консультантов и оформлении документов в страховых компаниях, посещении всевозможных центров, предоставляющих различные государственные услуги.
Отдельно стоит отметить возможности для ИТ-специалистов, разработчиков различных приложений.
1.2. Данные для науки
Наше время породило уникальное явление, позволяющее различным научным течениям проверить и скорректировать основополагающие теории и результаты открытий прошлого. Это возможность обратиться к самому ценному и честному архиву знаний о человечестве – данных, формирующих описание человеческой природы в размерах и формах, поражающих даже самое развитое воображение. Еще никогда научному сообществу не был доступен такой объем знаний о жизни, экономике, потреблении, передвижении и любых других сферах человеческой деятельности. Вместе с тем накопленный объем информации в частных компаниях, государственных, медицинских, образовательных и социальных институтах позволяет проводить уникальные по своим масштабам и качеству результатов исследования.
Нравится нам это или нет, но информация играет все более важную роль в жизни каждого из нас, и эта роль будет становиться значительнее. Сейчас в газетах встречаются целые разделы, полностью посвященные данным. В компаниях есть группы, единственная задача которых – анализ собранных данных. Инвесторы дают десятки миллионов долларов стартапам, если те могут собрать и сохранить большие объемы данных[21].
Знания и инструменты работы с данными позволяют формировать эффективные и точные прогностические модели даже в таких неожиданных областях, как избирательный процесс, что ранее невозможно было представить ни в социологии, ни в политологии.
Приведем несколько цитат из книги Сета Стивенса-Давидовица «Все лгут»: «…например, информация о том, кто на самом деле будет принимать участие в выборах. Больше половины граждан, которые не голосуют, говорят исследователям, проводящим опросы непосредственно перед выборами, что они намерены пойти голосовать, что искажает оценку явки, в то время как данные о поиске в Google по фразам “как голосовать” или “где голосовать” за неделю перед выборами помогут более точно предсказать, где предполагается большая активность на избирательных участках.
Можно даже узнать, за кого они пойдут голосовать. Мы со Стюартом Гэбриэлом, профессором университета штата Калифорния (Лос-Анджелес), нашли удивительную подсказку. Большой процент поисков, связанных с выборами, содержат запросы с именами обоих кандидатов. Во время выборов 2016 года, когда соперничали Дональд Трамп и Хиллари Клинтон, некоторые люди делали запрос: “выборы: Трамп – Клинтон”. Другие искали: “Клинтон – Трамп, дебаты”. По сути, 12 % поисковых запросов со словом “Трамп” включали и слово “Клинтон”. Более четверти поисковых запросов с фамилией Клинтон также содержали и фамилию Трамп. Мы обнаружили, что эти, казалось бы, нейтральные поиски могут дать нам некоторые подсказки о том, какого кандидата человек поддерживает. Как? Все зависит от порядка, в котором кандидаты появляются в запросе. Наши исследования показывают, что человек со значительно большей вероятностью поставит имя кандидата, которого он поддерживает, первым в поисковом запросе, содержащем имена обоих кандидатов»[22].
«Даже если вы обманываете самого себя, Google способен узнать правду. За пару дней до выборов вы и некоторые из ваших соседей можете считать, что обязательно пойдете на избирательный участок и проголосуете. Но если ни вы, ни они не искали информацию о том, как и где проголосовать, специалисты по поиску и обработке данных вроде меня могут сказать: явка в вашем районе будет низкой»[23].
1.3. Данные для бизнеса
Отдельно следует упомянуть так называемую цифровую трансформацию – скоростное и основательное изменение жизненных процессов посредством цифровизации. Эти изменения зачастую до неузнаваемости меняют процессы на предприятиях и в государственном управлении, которым не один десяток лет, но результаты подобных трансформаций поражают. Как 30 лет назад сказал генеральный директор FedEx Фред Смит (Fred Smith), «информация о посылке так же важна, как и сама посылка»[24].
Существует несколько ключевых факторов, играющих важнейшую роль в процессе цифровой трансформации.
● Основой решений для цифровой трансформации должны стать платформенные решения.
● Центральным местом процесса цифровой трансформации должны быть данные и процессы, позволяющие их использовать.
● Все сотрудники компании, работающие с данными, будь то юристы, менеджеры по продажам или специалисты по логистике, должны быть «владельцами данных», вовлеченными в процесс цифровой трансформации.
● Основные предметные области должны быть основой трансформации, например клиент и всевозможные данные, относящиеся к нему.
● Должен быть обеспечен цифровой профиль основных данных: чем их больше, тем лучше.
● Ключевые менеджеры должны иметь доступ к различным срезам данных для формирования нововведений и творчества.
● При достаточном уровне качества данных искусственный интеллект становится эффективным инструментарием.
● Необходимы метрики стоимости работы с данными (стоимость хранения, стоимость использования данных, эффекты от работы с данными).
● Цифровая трансформация – это процесс, увеличивающий эффективность деятельности по мере его развития.
● Цифровая трансформация без ее глубинного понимания может стать самым дорогим проектом компании и привести к ее банкротству.
Цифровые технологии можно без преувеличения назвать фактором революционного изменения всех устоявшихся бизнес-процессов и существенного повышения эффективности деятельности. Организации, которые проигнорируют необходимость цифровой трансформации или допустят ошибки на стадии проектирования этого процесса, будут неэффективными и, возможно, будут вынуждены прекратить деятельность.
Тут стоит отметить, что мультинациональные корпорации одними из первых оценили возможности использования данных как в повседневных, так и в глобальных процессах трансформаций, поняв, что они все более и более зависимы от данных организации. Вместе с тем большинство современных мультинациональных компаний не смогли бы функционировать без единой ИТ-архитектуры и единой среды обеспечения данными. Практически все процессы крупнейших компаний мира основаны на эффективных инструментах работы с данными.
Не секрет, что крупные международные корпорации в процессе своего развития зачастую создавали и приобретали компании в разных уголках мира, имеющих свою специфику в области информационных технологий и, соответственно, довольно разрозненные информационные системы относительно друг друга. В результате компания приобретала абсолютно неструктурированные и неупорядоченные данные, что существенно осложняло работу всех ИТ-систем в рамках единой организации. В этих условиях важный инструмент работы с данными в мультинациональных компаниях и организациях, повышающий эффективность деятельности компаний и учитывающий широкий портфель продуктов, – внедрение единой платформы управления данными. Вот как в общих чертах выглядит подобная единая платформа управления данными на примере крупной международной страховой группы (рис. 1.2).
Одной из самых заметных тенденций в области работы с данными в корпоративном мире в последнее время становится построение бизнес-процессов компаний на основании данных. Формируется «дата-центричный» подход, что во многом обусловлено пониманием эффекта использования данных для различных направлений деятельности компаний. Сейчас уже принимается за правило выделять и рассматривать различные информационные системы как источники данных, обогащать эти данные и формировать их ценность. Проектирование архитектуры данных становится отдельным направлением деятельности организаций. Самые важные бизнес-процессы перестраивают именно на основе этой архитектуры (рис. 1.3).
Только после формирования архитектуры данных компании формируют функциональную и ИТ-архитектуру, описывая логическую и физическую модель работы с данными в организации. Все это приводит к тому, что фактическая функция ИТ становится вспомогательной по отношению к функции управления данными (рис. 1.4).
Чтобы оценить масштабы эффективности внедрения цифровых технологий, посмотрим на исследование, проведенное российской компанией «Юнидата». Оно показывает, что одним из самых востребованных направлений оптимизации бизнес-процессов с использованием решений для управления данными являются решения класса “Единый каталог товаров, работ и услуг” (ЕКТРУ), позволяющие повысить эффективность закупок для компаний и организаций. Те, кто пренебрегает подобными возможностями, с большой вероятностью станут неконкурентоспособными по отношению к коллегам, уделяющим должное внимание данному направлению деятельности.
Внедрение ЕКТРУ позволяет компании обеспечить прозрачность процесса закупок, вести в одном месте закупаемую номенклатуру, иметь полную информацию о товарах/услугах, их технических характеристиках, поставщиках, стоимости, аналогах, условиях и сроках гарантийных обязательств, стоимости и условиях поставки, наличии изделий на складах и в производстве и многих других параметрах. Один из следующих шагов внедрения ЕКТРУ – создание различных интерпретаций личного кабинета, позволяющего поставщикам предоставлять всю необходимую информацию о поставляемых продуктах и услугах непосредственно заказчику, а тому в свою очередь иметь актуальную информацию для обеспечения своей деятельности и оптимизации бизнес-процессов.
Основные результаты внедрения Единого каталога товаров, работ и услуг
● Создание и ведение параметрических классификаторов, обеспечивающих возможность формирования специализированного атрибутивного состава для каждого класса товаров, работ и услуг.
● Применение единого словаря терминов при ведении каталожных описаний.
● Возможность создания и ведения стандартных форматов описания (СФО) предметов потребления, на основании которых формируются каталожные описания конкретных номенклатурных позиций.
● Управление структурой каталога, классификаторами, опорными справочниками и другими объектами ЕКТРУ через пользовательский интерфейс платформы без привлечения разработчиков.
● Гибкая настраиваемая ролевая модель доступа к данным и функциям каталога.
● Реализация настраиваемых процессов согласования внесения изменений в каталог на основе утвержденного регламента ведения ЕКТРУ. Обеспечение автоматизированного контроля за ходом и результатами соблюдения регламента.
● Возможность применения встроенных в платформу управления данными механизмов консолидации, дедубликации, обеспечения качества данных.
Эффекты внедрения Единого каталога товаров, работ и услуг
● Увеличение рентабельности предприятия за счет снижения складских запасов (по экспертным оценкам, от 5 до 25 %) и оптимизации резервирования материально-технических ресурсов.
● Оптимизация расходов на закупку материально-технических ресурсов за счет снижения количества избыточных заказов при закупке однотипной продукции (по экспертным оценкам, 3–5 %).
● Уменьшение ошибок в корпоративной отчетности, связанных с неактуальностью справочной информации, и, как следствие, повышение качества принимаемых управленческих решений.
● Предотвращение материальных потерь, связанных с закупкой неликвида (по экспертным оценкам, в среднем предприятия теряют из-за приобретения неликвида от 10 до 30 % от общего бюджета закупок).
● Предотвращение материальных потерь за счет экономии человеческих ресурсов предприятия благодаря грамотному и качественному обмену данными между отделами, цехами и службами (по экспертным оценкам, от 5 до 25 %).
● Достоверная информация о фактическом объеме складских запасов, статистике движения (поступления/расхода) материалов, увеличения необоснованных запасов, замораживания оборотных средств.
● Однозначная идентификация клиентов, повышение лояльности клиентов за счет наличия полной и достоверной информации о профиле клиентов, наличие информации о неблагонадежных партнерах/клиентах, повышение эффективности привлечения новых клиентов и групп клиентов за счет корректных фокус-групп.
● Повышение качества формирования закупок за счет накопленной статистики по товарам и товарным группам, поставщикам, параметрическим показателям товаров и услуг.
● Снижение затрат за счет отсутствия ошибок в адресах доставки товаров и корреспонденции.
● Сокращение поставок более дорогостоящих изделий с избыточными свойствами. Увеличение числа поставок более дешевых аналогов и заместителей, обладающих аналогичными свойствами оригинала, в том числе и при осуществлении импортозамещения.
● Снижение затрат на закупки при улучшенной консолидации закупочных партий.
● Повышение контроля в сфере закупок.
● Автоматизация всего закупочного процесса (подготовки документации для проведения закупки, определения начальной максимальной цены контракта, закупочной процедуры и последующих процессов оформления документов в строгом соответствии с закупочной процедурой).
● Снижение стоимости владения изделиями за счет подробного описания состава изделия и применимости ремонта и использования комплектующих при ремонте с учетом сроков гарантии каждой детали.
1.4. Данные для торговых сетей
Дальнейшее использование данных и технологий работы с ними изменит не только бизнес-процессы, но и сами отрасли.
Работа с данными позволит существенно повысить эффективность бизнес-процессов, снизить стоимость продукции при использовании унифицированных данных по продукции, создать единообразие продукции, увидеть наличие данных по аналогам и параметрической информации о товарах, статистику о закупаемых изделиях и наличие продукции на складах, объединять данные из информационных систем, оперирующих информацией о гарантийных обязательствах, сроках ремонта и обслуживания изделий.
Вместе с тем в будущем большинство организаций будут вынуждены кардинально перестроить свою деятельность.
Уже сегодня большой процент заказчиков покупает товары повседневной необходимости через интернет-магазины или приложения, что приводит торговые компании к необходимости оптимизации (зачастую закрытия) торговых сетей или отдельных торговых точек. Это также связано с тем, что покупатели довольно консервативны в своих предпочтениях и приобретают одни и те же товары, потребительские свойства которых им известны. Можно с уверенностью сказать, что спектр товаров, приобретаемых онлайн, будет расширяться. Производителям и торговым сетям эти изменения позволят иметь более точную информацию о своих клиентах, их предпочтениях и пожеланиях.
Тенденция распространится на товары более длительного использования, например одежду, электронику, автомобили. Это приведет к изменениям работы торговых сетей и их взаимоотношениям с производителями товаров, появлению новых экономических схем в сфере торговли. Модель работы изменится: в торговых сетях появится нескольких флагманских магазинов, основной целью которых будет не офлайн-продажа, а знакомство покупателей с товарами и их потребительскими свойствами. Указанная модель обеспечит огромное преимущество торговым сетям, которые первыми придут к такому формату и фактически заставят остальные сети последовать своему примеру, поскольку экономия на капитальных и операционных затратах по сравнению с классическими торговыми сетями будет гигантской благодаря отсутствию затрат на аренду помещений, оборудования, коммунальные платежи, логистику, хранение товаров, зарплаты персонала в большом количестве торговых точек и других издержек. Эта модель уже получила широкое распространение: покупатели посещают магазины/салоны исключительно чтобы увидеть искомое воочию и получить консультации о потребительских свойствах и функционале товаров офлайн, но приобретают понравившийся товар в интернет-магазине, где им предлагают более выгодную стоимость и удобство доставки.
«В середине января 2020 года производитель аудиотехники Bose объявил о закрытии 119 магазинов по всему миру. Причиной такого решения Bose назвал тот факт, что наушники, колонки и другие продукты компании все чаще приобретаются через интернет. Учитывая резкий переход к онлайн-покупкам на определенных рынках, Bose планирует закрыть все розничные магазины в Северной Америке, Европе, Японии и Австралии в течение нескольких месяцев. Однако в других частях мира магазины Bose останутся открытыми, включая около 130 магазинов, расположенных в Китае и Объединенных Арабских Эмиратах, Индии, Юго-Восточной Азии и Южной Корее»[25].
По этому пути уже довольно успешно идут компании и организации, предоставляющие различные услуги, которые заказчики приобретают исключительно онлайн.
Успешность деятельности этих организаций будет обеспечиваться эффективностью используемых ими ИТ-решений и в первую очередь решений по управлению данными, а традиционные для торговых сетей и предприятий затраты на аренду помещений, оборудования, стоимость персонала, оборачиваемость продукции в каждой торговой точке, перемещение товаров по цепочке «производитель – склад – магазин – покупатель» станут несущественными.
По нашему мнению, подобный формат работы торговых сетей сделает более эффективным и прозрачным механизм взаимодействия с государством, обеспечит на более качественном уровне администрирование уплаты различных налогов, акцизов, таможенных пошлин и других платежей в бюджеты государства различных уровней.
Необходимо также учитывать тот эффект, который на процессы цифровизации оказали события, связанные с COVID-19. По мнению многих специалистов, это существенно ускорило трансформацию различных индустрий. Ритейл стал одной из самых динамичных отраслей в переходе на новые цифровые технологии и процессы.
За несколько месяцев пандемии торговые сети сгенерировали огромный объем данных о своих клиентах (которые практически мгновенно из офлайна перешли в онлайн), что позволило сформировать полноценный профиль клиента. Благодаря всем этим изменениям покупатели могут анализировать свои предпочтения, использовать службы доставки, экономя время, а также более четко планировать покупки. Ритейл-компании, перестроившие свои бизнес-процессы на основе технологий работы с данными, обеспечили себя полной информацией о своих клиентах, их местах пребывания, средствах и технологиях оплаты товаров, предпочтительных программах лояльности, объемах потребления, составе семьи, предпочтениях в различных товарных группах и других данных, позволяющих существенно повысить эффективность взаимодействия с покупателями.
Торговые сети уже довольно давно используют технологии работы с данными: «Например, Walmart использует данные о продажах во всех своих магазинах, чтобы знать, какие продукты следует пока отложить. До урагана Фрэнсис – разрушительного шторма, обрушившегося на юго-восток США в 2004 году, – компания Walmart подозревала (и совершенно справедливо), что, когда город переживет удар стихии, покупательские привычки людей могут измениться. Эксперты компании изучили данные по продажам после предыдущих ураганов, стараясь понять, что именно люди, возможно, захотят купить. Какой товар оказался самым популярным? Клубничное печенье. За несколько дней до урагана этот продукт продается в семь раз быстрее, чем обычно»[26].
1.5. Данные для государства
Сейчас даже сложно предположить, насколько управление данными может быть эффективным для государства, объем сервисов которого возрастает с каждым днем, они становятся гораздо удобнее, позволяя гражданам не только получать услуги с невиданным ранее качеством и скоростью, но и открывать иные возможности для общения государства с гражданами, а также давая возможность оперировать качественными данными для принятия управленческих решений.
С точки зрения архитектуры подобных решений необходимо рассматривать совершенно новый подход, позволяющий в дальнейшем производителям, разработчикам и различным новым функциональным заказчикам обеспечить единую платформу для построения и расширения текущих конфигураций (рис. 1.5).
Возможность обеспечения цифровых сервисов для избирателей позволит предоставить всем сторонам, участвующим в процедуре выборов, новое качество процесса, его мониторинга и прозрачности. Цифровые технологии позволят обеспечить эффективный и качественный механизм формирования реестра избирателей (в электронном виде) со всевозможными правилами качества (создание «золотой записи» избирателя для однозначной идентификации гражданина [рис. 1.6]), поддержку ведения цифрового регистра избирателя с возможностью отслеживания «жизненного цикла» избирателя (рис. 1.7), сопоставление необходимых подборок по тем или иным параметрам выбора, возможность голосования на федеральных, региональных и муниципальных выборах и референдумах по месту нахождения за пределами региона в онлайн-формате (через электронное заявление об изменении участка), возможность избирательным комиссиям и наблюдателям осуществлять онлайн-мониторинг за подготовкой, проведением и подведением итогов выборов, а также предоставление им корректных и качественных аналитических отчетов.
С помощью инструментария работы с данными членами избирательных комиссий обеспечиваются прозрачность работы со всем массивом информации, корректность и прозрачность избирательного процесса (рис. 1.8).
Цифровые избирательные сервисы также обеспечат эффективную коммуникацию с каждым избирателем и позволят предоставить ему правдивую, полезную и персонифицированную информацию о выборах, а также всевозможную справочную информацию (рис. 1.9).
Вместе с тем качественная и полная информация об участниках избирательного процесса позволит предоставить цифровые сервисы в новом удобном и персонифицированном формате. Одним из цифровых сервисов избирательного процесса, существенно повышающих удобство участия в выборах, станут различные интерпретации личного кабинета (рис. 1.10–1.14).
В этом разделе также хотелось бы поделиться с читателями еще одним примером крайне эффективного механизма взаимодействия государства и общества. Это, по нашему мнению, именно тот случай, когда обе стороны получают огромные выгоды от сотрудничества. Речь идет о создании электронной трудовой книжки. Чтобы избежать сомнений в важности инструментария управления данными, приведем некоторые цифры по данному направлению, которыми оперирует Пенсионный фонд РФ.
● 44,2 млн пенсионеров
● 154 млн актуальных лицевых счетов в системе персонифицированного учета
● 22 млн получателей социальных выплат
● 8,5 млн получателей материнского (семейного) капитала
● 8,3 трлн рублей выплачено в 2018 году в виде пенсий и других социальных выплат
По нашему мнению, проект «Электронная трудовая книжка» – краеугольный камень в проекте «Цифровая экономика», поскольку отношения государства, работодателя и работника составляют основу экономических отношений во всем мире. В упрощенном виде эти отношения можно описать в виде схемы, приведенной на рисунке 1.15.
Подобный инструментарий предоставляет богатые возможности для взаимодействия всех участников данного проекта. Для государства очевидны следующие:
● строгий учет и контроль предоставления социальных услуг в полном объеме;
● персональное предоставление льгот, адресная социальная поддержка;
● сквозной контроль социальных бюджетов всех уровней;
● возможность реализации реестровой модели государственных услуг;
● подтверждение доступа к персональным данным цифровой подписью гражданина: возможность сервисов «Единая медицинская карта», «Электронная трудовая книжка», различные интерпретации удостоверений льготников и т. д.;
● подтверждение работником факта смены работы – электронная идентификация и передача данных; онлайн-учет;
● реестр изменений и детальная аналитика по всем срезам данных держателя за любой период (как по работнику, группам работников, географии, так и по работодателю, отраслевому признаку и т. д.);
● аналитика социального состояния общества в реальном времени.
Ключевым фактором успеха подобного проекта, как было сказано ранее, служит инструментарий для работы с огромным массивом данных, который будет сформирован единоразово, а органам исполнительной власти на постоянной основе нужно будет работать с ним, поскольку по каждому объекту учета имеется огромное количество сценариев изменения данных и сами данные, которые необходимо поддерживать в актуальном состоянии (рис. 1.16).
Вот только краткое перечисление преимуществ, которые лежат на поверхности и позволяют решить огромное количество текущих проблем в данной области:
● электронная трудовая книжка не теряется;
● наличие всегда актуальных данных в различных интерпретациях личного кабинета;
● фиксируется все (образование, стаж, должность, договор, оклад, выплаты, начисления, курсы повышения квалификации и другая информация), что позволяет составить наиболее полную картину о работнике и работодателе (рис. 1.17).
Также одна из ключевых задач создания электронной трудовой книжки – задача консолидации и гармонизации всего массива данных о работнике и работодателе в одной информационной системе, позволяющей обеспечить интероперабельность и непротиворечивость собранных данных из различных информационных систем целого ряда федеральных органов исполнительной власти (рис. 1.18).
Несмотря на организационную и техническую сложность проекта «Электронная трудовая книжка», его эффективность и возможность реализации может быть обеспечена за счет глубокого анализа текущих и проектирования будущих бизнес-процессов, профессиональной команды разработчиков, способных спланировать и реализовать архисложный процесс проектирования архитектуры, правильно сформулировать задачу и создать систему с огромным массивом данных.
Государству электронная трудовая книжка позволит сформировать массив данных для создания новых сервисов, которыми будут пользоваться федеральные и региональные органы исполнительной власти (рис. 1.19).
Отдельно стоит упомянуть новые аналитические возможности, предоставляемые электронной трудовой книжкой для формирования политики в области трудовых отношений, а также реализации краткосрочных, среднесрочных и долгосрочных планов в этой области (рис. 1.20).
Возможности информационной системы обеспечат также новым инструментарием коммерческие организации и позволят им эффективнее проводить свою политику в области работы с персоналом (рис. 1.21).
Одним из возможных инструментов могут быть средства поддержки мероприятий по поиску талантливых работников, специалистов редких областей и проведению конкурсов профессионального мастерства (рис. 1.22).
Нельзя не упомянуть, что электронная трудовая книжка – уникальный по своему удобству и эффективности инструментарий для работников.
Мы неоднократно сталкивались с потребностью в подобных инструментах как для создания различных цифровых сервисов в целом, так и для реализации их в одной из самых чувствительных для граждан социальной сфере государственных услуг. Зачастую нехватка или отсутствие обобщенной информации о гражданах не позволяет государственным институтам своевременно и эффективно проводить мероприятия социальной политики. Только объективные критерии, основанные на данных, дают возможность в режиме реального времени видеть картину происходящих изменений в обществе, вовремя оказывать услуги, обеспечивать поддержку и социальную защиту, предлагать всевозможные льготы и субсидии гражданам, а также выявлять нарушения и отсутствие оснований для указанных мер.
С технологической точки зрения накопление в одном месте огромного массива данных о гражданах может быть одним из самых эффективных инструментов обеспечения их прав. Возможность ведения информации о гражданах с высоким и низким доходом, о недвижимости и транспортных средствах во владении, о составе семьи, а также многих других атрибутах позволяет рассматривать цифровизацию с позитивной и созидательной стороны. Повышение эффективности взаимодействия государства и общества позволяет сделать колоссальный шаг вперед, но для этого необходимо преодолеть опасения граждан в отношении «некорректных сценариев» использования персональных данных, обеспечив гарантии их неприкосновенности, согласование использования и утилизацию, поскольку только гражданин должен иметь право на использование кем бы то ни было своего «цифрового двойника» (рис. 1.23).
Один из самых эффективных механизмов – создание инструментария работы с данными в рамках реализации сервисов, направленных как на существенное повышение эффективности деятельности государственного аппарата, так и на предоставление гражданам услуг в электронном виде. Это совершенно меняет модель взаимодействия государства и общества, а также позволяет экономить огромные средства и время аппарата государственного управления. Подобные инструменты позволяют сделать гигантский шаг на пути избавления государства от различного рода ошибок и манипуляций с данными, на которых теряются огромные средства.
Для движения в этом направлении необходимо проанализировать текущее состояние данных, которые являются основными для администрирования со стороны государства. Объем накопленных в государственных информационных системах данных огромный, но работа с ними далека от идеала, например, из-за отсутствия документирования информационных систем (в части данных), использования устаревшей или неправильной архитектуры или закрытости систем. Эти проблемы присущи не только государственным, но и корпоративным информационным системам, архитекторы которых в погоне за сиюминутным результатом и персонифицированностью закладывают «мину замедленного действия» под возможностью развития систем и совместного использования данных для решения более широкого круга задач.
Одно из самых перспективных направлений работы с данными для государства и общества – создание информационных систем, актуальных практически для всех направлений деятельности. Сюда относятся такие решения, как «Цифровой профиль гражданина», «Цифровой профиль юридического лица», «Цифровой профиль изделия», «Цифровой профиль здания», «Цифровой профиль транспортного средства». Подобный подход применим фактически для всех объектов со сложной описательной частью.
Уже сейчас проекты цифровизации приносят ощутимую пользу, и в ближайшем будущем именно эти направления будут одними из наиболее востребованных. В качестве примера можно привести преимущества проекта «Цифровой профиль гражданина».
1. Единая точка концентрации данных.
1.1. Сведения о гражданине – цифровой профиль.
1.2. Сведения об объектах, относящихся к гражданину (движимое и недвижимое имущество).
1.3. Права и обязанности граждан.
1.4. Действия граждан (использование и оплата различных государственных сервисов: налоги, субсидии, штрафы и т. п.).
2. Обработка и аналитика.
2.1. Система помощи принятия и поддержки управленческих решений.
2.2. Подготовка прогнозов на основе данных.
3. Контроль качества данных.
3.1. Единые стандарты хранения и обработки данных.
3.2. Контроль соблюдения единых стандартов данных.
В качестве ключевых целей внедрения решения «Цифровой профиль гражданина» можно выделить следующие:
● сокращение расходов бюджета – путем обработки и аналитики данных выявление неэффективного расходования средств;
● аргументированное принятие решений – повышение качества данных, на основе которых принимаются ключевые решения.
При объединении сведений о гражданах из различных источников государственные органы неминуемо столкнутся с конфликтами в данных, что позволит выявить либо недобросовестных граждан, получающих поддержку государства, которая им не положена, либо граждан, имеющих право на господдержку, но по каким-то причинам ее не получающим.
Также «Цифровой профиль гражданина» обеспечивает взаимодействие граждан и государства в режиме онлайн, предоставляя предиктивные услуги и всевозможные сервисы по информированию.
Отдельно стоит отметить использование данных в спорте – особой сфере деятельности как общества, так и государства, которое обеспечивает и формирует среду для активного образа жизни.
Управление спортом, если его рассматривать как информационную систему, имеет много общего с аналогичными системами из других областей, но здесь есть и свои отраслевые отличия. Если говорить о спорте, то наверняка каждый читатель сразу назовет большое количество категорий данных: это различные спортивные дисциплины, федерации, тренеры, спортсмены, медицинский персонал, спортивные объекты и сооружения, разряды, названия спортивных соревнований и мероприятий, результаты, научные и методические работы. Каждая категория включает в себя сотни атрибутов и тысячи показателей. Многие из них взаимосвязаны, что позволяет на основе данных и выявленных в ходе их анализа закономерностей планировать и реализовывать политику в области управления спортом.
Литература к главе 1
• DAMA International. DAMA-DMBOK: Data Management Body of Knowledge: 2nd Edition. Technics Publications, 2017. (Русский перевод: DAMA-DMBOK: Свод знаний по управлению данными. Второе издание / Dama International. – М.: Олимп-Бизнес, 2020.)
• Laney D. B. Infonomics: How to Monetize, Manage, and Measure Information as an Asset for Competitive Advantage; Routledge; 1st edition, 2017. (Русский перевод: Даглас Лейни. Инфономика: информация как актив: монетизация, оценка, управление. – М.: Точка, 2020. – [Библиотека «Айтеко»].)
• Stephens-Davidowitz, S. Everybody lies. Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are. 2017.
Глава 2. От данных к мудрости
2.1. Данные и информация
Прежде чем начать разбираться в вопросах управления и извлечения ценности из данных, стоит подробнее остановиться на терминах «данные» (data) и «информация» (information) и их значениях. Применительно к сфере управления данными эти термины часто используют как синонимы, но во многих случаях значения различают[27][28]. Понять разницу поможет экскурс в историю их происхождения.
В английском языке слово information появилось гораздо раньше, чем слово data, – в конце XIV века. Слово пришло из старофранцузского языка. Французские information, informateur – производные от informer – «осведомлять, сообщать, делать известным». Первоисточник – латинское informatio – «разъяснение, истолкование, сообщение». От in – «в, к, в направлении» + forma – «форма». Истоки слова «форма» неизвестны[29][30].
Во второй половине XV века за словом information закрепилось значение «переданные сведения, относящиеся к определенной теме». Сфера применения постепенно расширялась. В частности, в XX веке слово стало появляться в документальных источниках в связи с передачей телевизионных сигналов – с 1937 года, применением перфокарт – c 1944-го, анализом ДНК – с 1953-го. Термин «теория информации» (information theory) используется с 1950 года, «информационная технология» (information technology) – с 1958-го (впервые появился в журнале Harvard Business Review), «информационная революция» (information revolution) – с 1966-го, «информационная перегрузка» (information overload) – с 1967-го.
В русский язык слово «информация» пришло из западноевропейских языков при Петре I – в начале XVIII века (но в словарях появляется лишь во второй половине XIX века). Основные значения – «сообщения, сведения, пояснения».
Что же касается слова data, то оно в английском языке стало использоваться (в значении, близком к сегодняшнему) в 1640-х годах – более чем на два столетия позже слова information.
Слово data произошло от латинского datum – «данная вещь» (от латинского dare – «давать»). Оно применяется как во множественном, так и в единственном числе, однако в научной литературе для единственного числа может использоваться термин datum.
1640-е годы – время начала Английской гражданской войны, открывшей путь к промышленной революции XVIII–XIX веков. Одновременно это было время осуществления первой научной революции и возникновения классической европейской науки. Слова data и datum в значении «данные или предоставленные факты» впервые появились в работах английского священника Генри Хаммонда (Henry Hammond), который, как и многие представители его профессии в то время, участвовал в формировании основ классической науки[31][32].
Начиная с работ Хаммонда слово information стало все чаще и чаще дублироваться словом data, чему способствовала научная революция, наступление «Века разума» (The Age of Reason) и эпохи Просвещения. Появилось (благодаря быстрому распространению книгопечатания, изобретенного Гуттенбергом в 1450 году) большое количество книг по уже существовавшим и вновь появляющимся отраслям науки. Таким образом, был создан и активно обрабатывался огромный объем совместно используемых сведений. Для обозначения таких сведений, предоставляемых для обсуждения и осмысления, начал применяться термин data (сначала в классическом значении – «факты, данные в качестве основы для вычислений при решении математических задач»), более подходящий в данном случае, чем термин information[33].
Необходимо отметить еще одно важное слово, появление которого оказало существенное влияние на дальнейшее распространение термина «данные». В 1798 году Джон Синклер[34] в своем «Статистическом отчете о Шотландии» ввел в английский язык термин «статистика». По определению Синклера, статистика – это собрание фактов, которые совершенно не обязательно должны были быть представлены (и даже в основном не были представлены) в числовом виде. Однако с 1829 года слово statistics стало употребляться в английских документальных источниках в более строгом значении – «собранные и классифицированные числовые данные». С этого момента изучение любого предмета стало сопровождаться проведением всеобъемлющих подсчетов[35].
Широкое распространение статистических методов привело к тесной смысловой привязке термина data к термину statistics. В 1897 году в документальных источниках на английском языке слово data стало использоваться в новом значении – «факты в числовом виде, собранные для дальнейшего использования».
В XX веке спектр значений cлова data существенно расширился.
В 1946 году появилось значение «передаваемая и хранимая информация, с помощью которой осуществляется выполнение компьютерных операций»[36].
Стали использоваться новые термины: «обработка данных» (data processing) – с 1954 года, «база данных» (database) – с 1962 года, «ввод данных» (data entry) – с 1970 года[37].
В русском языке слово «данные» – производное от «дать», «давать». Родственно древнеиндийскому слову datis – «дар». Данные – то, что дано, найдено. В толковом словаре Даля «данныя, данности – известное, бесспорное, очевидное, верное, все, что служит основанием для какого-либо вывода, расчета, заключения»[38]. В энциклопедическом словаре Брокгауза и Ефрона приведено следующее определение: «В вопросах математики данные суть величины, значения которых известны или предполагаются известными; зная их, требуется в рассматриваемом вопросе определить искомые неизвестные величины.
Данные (Δεδόμενα) есть заглавие одного из сочинений Эвклида, составляющего продолжение его “Элементов”. Можно указать несколько изданий этой книги: Гарди в 1625 году с греческим текстом и Баррова в 1659 году Эвклид называет данным все то, что на основании теорем, заключающихся в элементах, непосредственно следует из условий задачи. Например, если проводим из данной точки прямую, касательную к данному кругу, то эта прямая есть данная по величине и положению»[39].
Приведем несколько современных определений.
Согласно «Оксфордскому словарю современного английского языка»[40]:
● Data: 1) Известные факты, используемые для вывода или расчета. 2) Числовые и нечисловые значения характеристик кого-либо (чего-либо), с которыми выполняет операции компьютер или какое-нибудь другое подобное устройство.
● Information: 1) a) Что-то, что было сообщено; знания. б) Элементы знаний; новости. 2) Обвинение или жалоба, поданная в суд и т. п.
Согласно «Новому словарю русского языка»[41]:
● Данные: 1) Сведения, факты, характеризующие кого-либо, что-либо, необходимые для каких-либо выводов, решений. 2) Свойства, способности, качества как условия или основания, необходимые для чего-либо.
● Информация: 1) Сообщение о положении дел где-либо, о состоянии чего-либо. 2) а) Сведения об окружающем мире и протекающих в нем процессах, воспринимаемые человеком или специальными устройствами. б) Обмен такими сведениями между людьми и специальными устройствами. в) Обмен сигналами в животном и растительном мире. 3) То же, что: информирование.
Все это позволяет понять разницу между понятиями «данные» и «информация» и очертить преимущественные сферы их применения.
Следует заметить, что здесь в отношении термина «информация» мы ограничиваемся его общепринятыми нестрогими определениями и не обсуждаем научные определения, используемые в теории связи, теории информации и кибернетике и связанные с понятием количества информации. Отметим только, что известны два основных сугубо научных подхода к определению этого термина[42].
Согласно первому, информация – это внешнее описание объекта, содержащееся в передаваемом сообщении. Количество информации определяется как мера неопределенности, снимаемой полученным сообщением. Такое представление в 1948 году ввел Клод Шеннон[43] в своей статье «Математическая теория связи», попутно предложив для обозначения наименьшей единицы информации использовать слово «бит».
Согласно второму подходу, информация не связывается с передаваемым сообщением. Она относится к объекту и есть мера его разнообразия. Автор этого представления – Уильям Эшби[44].
Указанные научные определения в дальнейшем в этой книге не используются, поскольку ценность информации слабо связана с ее количеством. Важность информации субъективна и зависит от цели ее потребителя. Все способы количественного определения ценности основаны на представлении о цели, достижению которой способствует полученная информация. Чем больше информация помогает достижению цели, тем более ценной она считается[45]. Массив информации объемом в сотни гигабайт может иметь колоссальную важность для одной организации и нулевую для другой.
Основываясь на приведенных сведениях, можно продолжить обсуждение вопросов, относящихся к ценности данных.
Как уже говорилось выше, применительно к сфере управления данными термины «данные» и «информация» часто используются как синонимы. Кроме того, как видно из приведенных выше определений, термин «информация» иногда заменяется термином «знания».
Всегда ли допустимо такое обобщение и не приводит ли оно к недоразумениям? В частности, к существенному недопониманию между участниками многочисленных проектов по внедрению различного рода информационных систем, а также между участниками их дальнейшей эксплуатации и пользователями. В том числе и по вопросам определения ценности данных.
Для ответа необходимо более подробно обсудить взаимосвязь понятий «данные» и «информация», а также соотнести их с понятиями «знания» (knowledge) и «мудрость» (wisdom).
2.2. Информационная иерархия
При обсуждении взаимосвязи понятий «данные», «информация», «знания» и «мудрость» обычно используется классическое представление – иерархия Data-Information-Knowledge-Wisdom (DIKW). Часто в литературе применяются названия «иерархия знаний», «пирамида знаний» или же «информационная иерархия», «информационная пирамида».
В большинстве исследований, посвященных происхождению иерархии DIKW (например,[46][47][48]) в качестве одного из наиболее ранних источников, в которых встречается ее описание, обычно упоминается статья Харлана Кливленда[49] «Информация как ресурс». Она была опубликована в 1982 году в американском журнале The Futurist[50].
По мнению Кливленда, данные образуются в результате исследований, а также путем создания или сбора или же совершения открытий, в то время как информация имеет контекст. Данные превращаются в информацию с помощью организации их таким образом, чтобы мы могли легко делать какие-либо заключения. Кроме того, они преобразуются в информацию с помощью представления (презентации), например в визуальной или аудиальной (звуковой) форме.
Хотя известно несколько более ранних публикаций других авторов, затрагивающих эту тему[51], статья Кливленда цитируется особенно часто и примечательна фрагментом из поэмы Томаса Элиота[52] «Камень» (The Rock), написанной в 1934 году, в которой отражена иерархическая взаимосвязь понятий «информация», «знания» и «мудрость».
- Where is the Life we have lost in living?
- Where is the wisdom we have lost in knowledge?
- Where is the knowledge we have lost in information?
- Где Жизнь, которую мы потеряли в жизни?
- Где мудрость, которую, мы потеряли в знаниях?
- Где знания, которые мы потеряли в информации?
Кливленд назвал определенную в поэме цепочку понятий «иерархией Элиота». После выхода его статьи в специальной литературе прочно закрепилось мнение о том, что именно Элиоту принадлежит авторство идеи иерархии DIKW (или, по крайней мере, IKW)[53].
Среди академических работ, в которых рассматривается иерархия DIKW, наиболее ранней стала статья Милана Желены[54] «Системы поддержки управления: На пути к интегрированному управлению знаниями»[55]. В ней описана схема последовательного продвижения от данных к знаниям. Ученый предложил упрощенные определения уровней иерархии, основанные на знании ответов на простые вопросы.
● Данные – «не знаю – ничего» (know-nothing).
● Информация – «знаю – что» (know-what).
● Знания – «знаю – как» (know-how).
● Мудрость – «знаю – почему» (know-why).
В то же время Желены заметил, что, хотя данные и информация (благодаря их атомарной, дробной, нецелостной природе) могут быть сгенерированы без интерпретации человеком, знания и мудрость зависят от человека и контекста и не могут быть рассмотрены без использования процедур оценки и принятия решения человеком.
Автором одного из наиболее систематизированных и целостных описаний взаимосвязи понятий «данные», «информация», «знания» и «мудрость» часто называют Рассела Акоффа[56]. В 1989 году был опубликован текст его президентского обращения к Международному обществу общесистемных исследований (International Society for General Systems Research, ISGSR) под заголовком «От данных к мудрости»[57].
Хотя размышления Акоффа относятся к иерархии типов содержания человеческого разума, они справедливы и по отношению к информационным системам. Иерархия описывается следующим образом. «Мудрость» находится на вершине иерархии. Ниже следуют «понимание»[58], «знание», «информация» и в самом низу – «данные». Каждый из уровней включает содержание уровней, расположенных ниже, – например, не может быть мудрости без понимания и понимания без знания.
Акофф предлагает следующие определения данных, информации, знаний и мудрости, а также связанных с ними процессов трансформации.
● Данные – это символы, представляющие свойства объектов, событий и их окружения. Это результаты наблюдений. Наблюдать означает ощущать. Технология ощущений, ее инструментализация, конечно, высоко развита у человека от природы. Информация, как уже отмечалось, извлекается из данных с помощью их анализа, во многих аспектах которого компьютеры превосходны.
Данные, подобно железной руде, не имеют ценности, пока они не преобразуются в соответствующую полезную форму. Поэтому разница между данными и информацией не структуральная, а функциональная, данные обычно редуцируются при их преобразовании в информацию.
● Информация состоит из описаний, ответов на вопросы, начинающиеся с таких слов, как «кто», «что», «где», «когда», «сколько». Информационные системы генерируют, запоминают, извлекают и обрабатывают данные. Во многих случаях обработка носит статистический или арифметический характер. В любом случае информация выводится из данных.
● Знание есть ноу-хау, например о том, как система работает. Знание позволяет преобразовать информацию в инструкции. Оно делает возможным контроль над системой.
Знание может быть обретено двумя путями: либо получением его от тех, кто им обладает, либо извлечением из собственного практического опыта. В любом случае приобретение знания есть обучение. Когда программируются компьютеры, они «обучаются», как сделать что-то.
● Мудрость есть способность увеличивать эффективность по цели, (effectiveness), в то время как информация и знание сосредоточены на эффективности по средствам (efficiency)[59].
Мудрость имеет большую ценность благодаря ментальной функции, которую мы называем суждением. Все оценки эффективности основаны на логике, которая может быть определена, а значит, запрограммирована и автоматизирована. Эти принципы общи и объективны. Мы можем говорить об эффективности действия безотносительно к исполнителю. А по отношению к суждению это не так. Ценность действия всегда зависит от того, кто действует, редко когда она одинакова для двух исполнителей, даже если они делают одно и то же. Эффективность по средствам не связана с мотивами деятельности; а эффективность по целям определяется именно этическими и эстетическими ценностями. Они являются уникальными и персональными.
По мнению Акоффа, элементы иерархии DIKW имеют временное измерение. Информация, подобно новостям, довольно быстро стареет. Знание живет дольше, хотя и оно неизбежно устаревает. Мудрость имеет вечную значимость для человечества (если она не утрачивается).
Позже американские эксперты в области теории организаций (Bellinger и др.[60]) выступили с критикой расширения Акоффом иерархии DIKW за счет «понимания»», уточнив, что «понимание» не является отдельным уровнем, а скорее поддерживает переходы с предыдущих уровней на следующие (рис. 2.1).
* Bellinger G., Castro D., Mills A. Data, Information, Knowledge, & Wisdom, 2004. – URL: http://www.systems-thinking.org/dikw/dikw.htm.
Согласно приводимому исследованию данные представляют факты или утверждения о событии без связи с другими вещами.
Пример. Идет дождь.
Информация содержит понимание какой-либо связи, возможно причинно-следственной.
Пример. Температура упала на 15 градусов, а потом пошел дождь.
Знания отражают паттерн, который связывает факты и обычно обеспечивает высокий уровень предсказуемости относительно того, что описано или что произойдет дальше.
Пример. Если влажность очень высокая и температура существенно падает, то влага вряд ли сможет удержатьcя в атмосфере, поэтому обычно идет дождь.
Мудрость воплощает более глубокое понимание фундаментальных принципов, содержащихся в знании, которые, по сути, являются основой знаний. Мудрость носит системный характер.
Пример. Идет дождь, потому что идет дождь. И это включает в себя понимание всех взаимодействий, которые происходят между дождем, испарением, воздушными потоками, температурными градиентами и сопровождающими их изменениями.
Чаще всего иерархия DIKW изображается в виде пирамиды (рис. 2.2). Такое графическое представление впервые появилось в работе[61] (об этом, в частности, сообщается в обзорной статье[62]).
* Hey J. The Data, Information, Knowledge, Wisdom Chain: The Metaphorical link, published at Intergovernmental Oceanographic Commission (UNESCO) – OceanTeacher: a training system for ocean data and information management, 2004. – URL: https://web.archive.org/web/20071202033948/http://ioc.unesco.org/Oceanteacher/OceanTeacher2/02_InfTchSciCmm/DIKWchain.pdf.
2.3. Внутри пирамиды знаний
Чтобы составить достаточно полную картину взаимоотношений между уровнями пирамиды знаний в соответствии с современными общепринятыми взглядами, приведем более подробное описание этих уровней. Для этого воспользуемся сведениями из часто цитируемых обзоров наиболее известных монографий и руководств по информационным системам и управлению знаниями[63][64][65][66].
Начнем с определений.
1. Определение данных.
Чаще всего в определениях данных отмечается следующее:
● Данные – это дискретные, объективные факты или наблюдения, неорганизованные и необработанные, не передающие никакого конкретного смысла.
● Элементы данных – это простейшие записанные фрагменты описаний вещей, событий, действий и транзакций.
Данные не имеют смысла или ценности, потому что они лишены контекста и интерпретации.
Интересно, что выделяется преимущественно то, чего не хватает данным, – они лишены смысла или ценности, не организованы и не обработаны. Ввиду этих особенностей определения информации формулируются в терминах данных.
2. Определение информации.
Определения информации, как правило, опираются на ее взаимосвязь с данными. При этом используются такие понятия, как «формат», «структура», «организация», «смысл» и «ценность».
● Информация – это форматированные данные, которые могут быть определены как представление реальности.
● Информация – это данные, которые улучшают понимание предмета.
● Информация – это данные, представленные в форме, позволяющей им быть полезными и значимыми для людей.
● Информация – это данные, обработанные с определенной целью.
● Информация – это данные, которым придан смысл посредством добавления контекста.
Таким образом, информация в большинстве случаев определяется в терминах данных и рассматривается как организованные или структурированные данные[67]. Их обработка обеспечивает соответствие данных конкретной цели или контексту и тем самым делает их значимыми, ценными, полезными и релевантными.
3. Определение знаний.
Определения знаний обычно сложнее, чем определения данных или информации, поскольку, как правило, в литературе об управлении знаниями много внимания уделяется расширенному обсуждению природы знаний, а также различным вариантам их представления и проявления. Это делает отбор отличительных свойств знаний труднее, чем свойств данных и информации. В частности, встречаются такие высказывания:
● «Знания – по своей сути неясный и неоднозначный термин».
● «До сих пор нет единого мнения о природе знаний, за исключением того, что они основаны на восприятии, которое может дать им рациональное обоснование».
Тем не менее знания часто определяются в терминах данных и информации.
● «Знания – это совокупность данных и информации, к которым добавляются экспертные мнения, навыки и опыт, в результате чего получается ценный актив, который может быть использован для содействия принятию решений».
● «Знания – это данные и/или информация, которые были организованы и обработаны для передачи понимания, опыта, накопленных результатов обучения и компетенции, так чтобы их можно было применить при решении текущих проблем или в текущей деятельности».
● «Знания основываются на информации, извлеченной из данных. В то время как данные отражают свойства вещей, знания относятся к способностям людей, предрасполагающим их действовать определенным образом».
С точки зрения эпистемологии разделяются неявные знания и явные[68].
К неявным (неформализованным) знаниям (tacit knowledge) относятся опыт, мастерство, культура мышления, интуиция, хранящиеся в нейронных структурах головного мозга как результат генетической наследственности, образования и полученных жизненных уроков. Неявные знания существуют в умах специалистов, развиваясь во времени, через опыт, почерпнутый из профессиональной деятельности, книг, наставничества, а также обучения. Эти знания зависят от жизненных ресурсов личности, от ее биофизических свойств и психологического потенциала. Они заложены в индивиде и не могут быть легко переданы другим.
К явным (формализованным) знаниям (explicit knowledge) относятся описания теорий, методов, методик, технологий, механизмов и машин, конструкций, систем и т. п. Эти знания хранятся на реальных физических носителях. Они представлены в виде книг, бумажных документов, рисунков, схем, фильмов, аудио- и видеозаписей, электронных файлов, баз данных и т. п.
Знания существуют в континууме между неявными и явными знаниями. Явные знания – это неявные знания, которые были задокументированы[69].
Если суммировать встречающиеся определения, то знания можно рассматривать как совокупность данных, информации, понимания, умений, опыта, навыков и ценностей. Важно отметить, что не все авторы упоминают все эти элементы.
4. Определение мудрости.
К слову сказать, далеко не все авторы, описывающие иерархию DIKW, предлагают определение мудрости.
● Мудрость – это накопленные знания, позволяющие понять, как применять идеи и представления из одной области к новым ситуациям или проблемам.
● Мудрость – это высший уровень абстракции вкупе с предвидением и способностью смотреть за горизонт.
● Мудрость – это способность действовать, подходя критически или практически в любой конкретной ситуации. Она основана на этических суждениях, связанных с системой убеждений индивида.
Очевидно, что мудрость – еще более неуловимое и расплывчатое понятие, чем знания. Оно гораздо сильнее связано с человеческой интуицией, пониманием, интерпретацией и действиями, чем с информационными системами. При этом понятия «данные», «информация» и «знания» в определениях мудрости могут и не использоваться.
Наше обсуждение определений из различных источников показывает наличие консенсуса в отношении того, что по крайней мере данные, информация и знания должны определяться в терминах друг друга, хотя в качестве входных материалов для знаний могут выступать и данные, и информация.
Рассмотрев определения элементов иерархии DIKW, коротко обсудим процессы преобразования одного элемента в другой.
1. Преобразование данных в информацию.
Как уже отмечалось, согласно общепринятым представлениям, информация рассматривается как организованные или структурированные данные. Такая обработка обеспечивает соответствие данных конкретной цели или контексту и тем самым делает их значимыми, ценными, полезными и релевантными. Другими словами, структурирование данных в соответствии с некоторой схемой, имеющей значение и актуальность для отдельного человека, сообщества или задачи, наделяет их смыслом или, возможно, потенциалом для осмысления.
Важно заметить, что все данные (как только они собраны или переданы на хранение) в информационных системах и нашем сознании наделяются определенной структурой. Информационные системы всегда кодифицируют любой элемент данных для того, чтобы поместить его в базу данных, а затем найти для последующего использования. Люди, собирающие данные, должны разобраться в них, чтобы обеспечить их хранение с учетом взаимосвязей с уже накопленной информацией. Таким образом, если информация от данных отличается наличием структуры, то получается, что мы храним как в нашем сознании, так и в наших информационных системах именно информацию.
С другой стороны, смысл, который тот или иной элемент данных в базе данных имеет для конкретного человека, команды или организации, зависит от соответствия между структурой данных и внутренней когнитивной схемой человека, команды или организации. Если мы утверждаем, что в сознании человека хранится информация (а не данные), то подразумеваем, что признак, отличающий информацию от данных, это прежде всего смысл, а не структура. С этой точки зрения все, что хранится в информационных системах, – это данные.
В литературе можно встретить различные взгляды на роли структуры и смысла при преобразовании данных в информацию. Ясной общепринятой позиции по этому вопросу пока не выработано.
В ряде работ определены основные процессы, c помощью которых данные превращаются в информацию:
● классификация;
● перестановка/сортировка;
● агрегирование;
● выполнение вычислений;
● отбор.
При этом важно еще раз отметить, что именно получатель данных определяет, является сообщение данными или информацией. Смысл данных часто определяется через ассоциации с опытом или установление связей с другими данными. Понятие смысла субъективно, и то, что один человек считает ценной информацией, другой может воспринимать как данные, не имеющие особого значения.
2. Преобразование информации в знания.
Итак, информация обычно рассматривается как данные, обработанные таким образом, чтобы быть значимыми (имеющими смысл), ценными и подходящими для конкретной цели. В то же время знания рассматриваются как информация, применимая на практике (имеющая практическое значение), или информация в сочетании с пониманием и возможностями. Но, поскольку в основе определений информации лежит смысл, а для его выявления необходимо понимание, использовать практическую применимость или понимание в качестве признаков, отличающих знания от информации, кажется затруднительным.
Кроме того, различение явного знания и информации кажется еще менее оправданным. Если знания являются достоянием людей и воплощают в себе предшествующее понимание, опыт и результаты обучения, то трудно утверждать, что явные знания, зафиксированные в документах и информационных системах, чем-то отличаются от информации.
Часто выделяют следующие процессы, преобразующие информацию в знания:
● объединение информации из многих источников в течение определенного времени;
● структурирование убеждений;
● изучение предмета и приобретение опыта;
● организация и обработка информации для передачи понимания, опыта, накопленных результатов обучения и компетенции;
● интернализация[70] с обращением к внутренним когнитивным структурам.
3. Преобразование знаний в мудрость.
Если попытаться сформулировать суммарное определение мудрости на основе приведенных выше соображений, то можно сказать, что это способность действовать наиболее подходящим образом с учетом того, что известно (знания) и что приносит наибольшую пользу (социально-этические нормы).
Мы уже говорили, что мудрость – еще более неуловимое и расплывчатое понятие, чем знания. Оно сильно связано с человеческой интуицией, пониманием, интерпретацией и действиями. Поэтому в рамках данной книги, посвященной прежде всего управлению данными, углубляться в эти связи мы не будем. Отметим только, что важность вклада знаний (а следовательно, данных и информации) в формирование мудрости сомнений не вызывает.
На основе проведенного обсуждения можно сделать следующие выводы[71].
1. Иерархия DIKW в явном виде упоминается не всегда, но она подразумевается в определениях данных, информации, знаний и мудрости в большинстве источников. Обычно информация определяется в терминах данных, знания – в терминах информации, а мудрость – в терминах знаний.
2. В описании процессов, преобразующих элементы, находящиеся ниже в иерархии, в элементы, стоящие над ними, наблюдается меньшая согласованность, и из этого вытекает недостаточная четкость определений. В частности, в отношении следующих аспектов:
– Поскольку в качестве признаков, отличающих данные от информации, выделяются структура и смысл, точки зрения на то, хранится информация в информационных системах и в умах людей, или она образуется только в умах, могут расходиться[72].
– Определения информации (как данных, обработанных для того, чтобы быть значимыми, ценными и подходящими для конкретной цели) и знаний (как информации, имеющей практическое значение) частично совпадают. В связи с этим вопрос соотношения этих понятий нуждается в дальнейшем исследовании.
– Явные знания по своей сути практически не отличаются от информации.
Можно выделить следующие основные характеристики элементов иерархии DIKW, значения которых изменяются при переходе с уровня на уровень:
● ценность;
● cмысл;
● структура;
● широта применения;
● возможность передачи;
● необходимость участия человека при вводе (возможность автоматического ввода);
● возможность программируемой обработки;
● возможность передачи.
Изменение значений характеристик отражено на рисунке 2.3.
Уровни пирамиды знаний могут быть сопоставлены с классами информационных систем, которые преимущественно используются для работы с ними (рис. 2.4).
* Rowley J. The wisdom hierarchy: representations of the DIKW hierarchy. Journal of Information Science, 2007, 33(2), 163–180. DOI: 10.1177/0165551506070706. – URL: http://www-public.imtbs-tsp.eu/~gibson/Teaching/Teaching-ReadingMaterial/Rowley06.pdf.
2.4. Разрыв между данными и информацией
Хотя пирамида знаний служит общепринятой устоявшейся моделью, с каждым годом появляются новые публикации с предложениями по ее корректировке на основе учета современных тенденций.
Можно обратить внимание, например, на статью[73]. В ней справедливо отмечается, что, хотя общее количество собираемых данных стремительно возрастает, не все из них образуют базу для информации, не говоря уже о знаниях или мудрости. Нельзя не учитывать тот факт, что данные могут быть неточными или ложными. Таким образом, постоянно растущие собрания больших массивов данных также обязательно включают в себя и постоянно растущие собрания больших массивов неточных или ложных данных. На сегодняшний день нет никаких известных исследований, показывающих, остается ли удельный вес неточных или ложных данных постоянным по мере роста общего объема собираемых данных. Возможно, его величина сохраняется прежней или уменьшается, но не исключено, что доля неточных и ложных данных увеличивается. Это может происходить, в частности, из-за стремительного роста различного рода фейковых новостей или же по причине отрицательной реакции людей на сам сбор данных и т. п.[74] Поэтому просто сбор данных не приносит особой пользы. Что действительно ценно и необходимо, так это увеличение сбора точных и достоверных данных. Приведенные соображения, естественно, предполагают, что конечная цель получения данных – обретение знаний и мудрости, и не распространяются, например, на компании, чья основная деятельность – построение и обслуживание дата-центров, собирающих и хранящих любые данные.
Исходя из этого, в статье предложена нелинейная схема, отражающая взаимоотношения элементов иерархии DIKW (рис. 2.5). На ней элементы представлены в виде перекрывающихся и соприкасающихся областей (диаграмма Венна). Данные и информация не лежат в основе знаний и мудрости, а просто частично входят в их состав. В ближайшие годы область данных, вероятно, будет расти экспоненциально, но еще неизвестно, увеличатся ли в размерах какие-либо другие области. Преимущество приведенной диаграммы в том, что она точнее отражает соотношение представленных на ней понятий, чем пирамида знаний, и, что не менее важно, ориентирует на углубление знаний и обретение мудрости, а не просто на увеличение сбора данных.
* Van Meter, Heather J. Revising the DIKW Pyramid and the Real Relationship Between Data, Information, Knowledge and Wisdom. Law Technology and Humans, 2020, Vol. 2. No. 2, 69–80. DOI: 10.5204/lthj.1470. – URL: https://lthj.qut.edu.au/article/view/1470.
Основываясь на сведениях, полученных в ходе нашего обзора взаимоотношений между элементами иерархии DIKW, можно сказать, что с точки зрения этих взаимоотношений деятельность любой организации представляет собой множество циклических цепочек преобразований «данные – информация – знания»[75][76][77].
Данные появляются в результате выполнения каких-либо действий, например операций по продаже клиенту товара или предоставлению гражданину государственной услуги (рис. 2.6). Эти данные могут быть преобразованы в ценную информацию, в частности, если зафиксировать сведения о том, что для определенного клиента заказ выполнен повторно. В свою очередь эта информация наполняет хранилище, содержащее корпоративные знания и позволяющее на основании совокупности сведений о заказах сделать, допустим, следующий вывод: клиенты старше 40 лет лучше реагируют на недавно проведенную рекламную кампанию.
С учетом этих знаний организация может приступить к дальнейшим действиям, например провести целевую кампанию, направленную на охват клиентов в возрасте до 40 лет, что приведет к увеличению продаж. Соответственно, появятся новые данные, новая информация и новые знания, на основе которых будут осуществляться новые действия. Таким образом, цикл повторяется.
В этом цикле данные играют роль первичного строительного блока. Они возникают из действий и приводят к новым действиям. Эффективность преобразования данных в информацию определяет эффективность получения знаний, а также предпринимаемых на их основе дальнейших действий.
В этой связи область бизнес-аналитики (Business Intelligence, BI), обсуждаемую более подробно в следующих главах, можно представить как «завод по очистке данных» (рис. 2.7). Он превращает сырье (данные) в разнообразные информационные продукты: «информацию», которая собирается и агрегируется в хранилищах данных; «знания», которые собираются из запросов, сообщений и от аналитических инструментов; «планы», которые собираются по кусочкам из правил, закономерностей, моделей и схем, обнаруженных с помощью аналитических инструментов; и «действия», посредством которых бизнес-пользователи реализуют планы, генерирующие события, которые в свою очередь начинают новый цикл[78].
* Эккерсон У. Панели индикаторов как инструмент управления: ключевые показатели эффективности, мониторинг деятельности, оценка результатов / Пер. с англ. – М.: Альпина Бизнес Букс, 2007.
Между тем практика автоматизации большинства организаций показывает, что преобразование данных в информацию на сегодня слабейшее звено в описанной циклической цепочке. Очень часто мы наблюдаем своего рода разрыв (gap) между данными и информацией (см. рис. 2.6). Причиной могут явиться данные следующих категорий: плохо определенные, разрозненные, дублирующиеся, низкого качества или устаревшие. Кроме того, данных может быть недостаточно, или же, наоборот, слишком много. Устранение указанных слабых мест, повышение ценности данных – актуальнейшая задача для организации в современных условиях, если она хочет выжить и процветать[79].
Необходимым шагом в преодолении разрыва между данными и информацией является изменение отношения организации к своим данным. Она должна перестать относиться к данным как к побочному продукту (byproduct) операционной деятельности и начать рассматривать данные как стратегически важный ресурс[80][81]. Об этом мы поговорим в следующей главе.
В завершение этой главы обратим внимание на следующее. Обсуждая иерархию DIKW и ликвидацию разрыва между данными и информацией, мы рассматриваем эти понятия как разные вещи, в действительности они тесно переплетены и по отдельности друг от друга не существуют. Данные – это форма информации, а информация – это форма данных, что, в частности, отмечается в DAMA-DMBOK[82].
При этом в DAMA-DMBOK подчеркивается, что внутри организации полезно проводить четкую границу между информацией и данными хотя бы в целях более ясного донесения требований и ожиданий по различным направлениям практической работы до различных заинтересованных аудиторий. (Пример: «Предлагаем ознакомиться с отчетом о продажах за минувший квартал [информация]. Он составлен на основе данных нашего информационного хранилища [данные]. В следующем квартале эти результаты [данные] будут использованы для создания сравнительных показателей нашей работы по отношению к предыдущему кварталу [информация]».)
Признание различий между данными и информацией, а также между целями, для которых они могут быть использованы, служит основой стержневого постулата об управлении данными: предметом управления являются и данные, и информация; при этом качество и того и другого возрастает лишь при согласованном управлении с учетом потребностей конечных потребителей. Таким образом, когда мы говорим о преодолении разрыва межу данными и информацией, мы, по сути дела, подразумеваем плавный («бесшовный») переход одного в другое. Поэтому в дальнейшем в этой книге, как и в DAMA-DMBOK, термины «информация» и «данные» используются как взаимозаменяемые синонимы (за исключением тех случаев, когда это оговаривается особо).
Глава 3. От побочного продукта к стратегическому ресурсу
3.1. Эволюция концепций стратегического менеджмента
В предыдущей главе мы обратили внимание на то, что необходимый шаг в преодолении разрыва между данными и информацией – изменение отношения к данным. Организация должна перестать относиться к своим данным как к побочному продукту операционной деятельности и начать рассматривать их как один из наиболее важных ресурсов. Далее мы увидим, что в основе такого представления должна лежать стратегия организации – ключевой элемент управления бизнесом. Более того, мы будем подробно рассматривать тесно связанные с ней стратегию работы с данными и стратегию управления данными[83]. Для более глубокого понимания обсуждаемых далее вопросов целесообразно немного остановиться на понятиях «стратегия организации» и «стратегический менеджмент».
Как пишет Роберт Грант[84] в своем знаменитом учебнике «Современный стратегический анализ»[85], стратегия (на самом общем уровне) – это планирование способов, с помощью которых организация или индивид могут достичь поставленных целей. Как только мы переходим от общих понятий стратегии к более точному определению, то все начинает зависеть от того, на какой именно арене реализуется стратегия. Если говорить о войне, то стратегия заключается в том, чтобы одержать военную победу над врагом; если о политике, то речь пойдет о власти положения и поддержке электората, которая позволяет приобрести эту власть и удержать ее в своих руках; если о бизнесе, то стратегия обеспечивает выживание и процветание фирмы.
Учебный курс по стратегическому управлению бизнесом (политике бизнеса, или стратегии) давно стал обязательным для аккредитованных программ МВА, а зарождение этой дисциплины связано с процессом становления и роста в эпоху промышленного подъема конца XIX – начала XX века (наиболее массовым образом в США) крупных промышленных корпораций или, в терминологии А. Чандлера[86], «современного делового предприятия».
Задачи профессионализации управления новым типом организаций стимулировали создание в ведущих университетах США школ бизнеса, а вскоре и создание нового учебного курса, призванного интегрировать знания, получаемые студентами в функциональных курсах аккаунтинга, управления продажами и управления производством. В 1911 году в Гарвардской школе бизнеса впервые в мире началось преподавание курса, названного «Политика бизнеса» и ставшего прообразом нынешней учебной дисциплины стратегического управления[87].
В 1960-е годы вышло несколько ключевых работ, в которых был предложен ряд ставших классическими определений и концепций в области стратегического управления: «Стратегия и структура» А. Чандлера[88], коллективный учебник Гарвардской школы бизнеса «Политика бизнеса: Текст и кейсы»[89] и работа И. Ансоффа[90] «Корпоративная стратегия»[91].
В книге «Стратегия и структура» впервые были серьезно изучены процессы формирования крупных компаний. Описывая истории роста и административных изменений в General Motors, Sears, Standard Oil of New Jersey (Exxon) и DuPont, Чандлер показал, как их руководители выполняют работу по стратегическому управлению и достигают выдающихся результатов. Он утверждал, что решение о стратегии предшествует выбору адекватной ей организационной структуры. Ранее никто не рассматривал стратегию под таким углом. В начале 1960-х годов этот тезис быстро получил признание. Чандлеру принадлежит авторство термина «организационная инновация», описывающего случай разработки и внедрения нетривиальной организационной структуры (например, дивизиональной), востребованной для поддержки новой стратегии (диверсификации).
В «Стратегии и структуре» введен и концептуализирован термин «стратегия» вместо привычного термина «политика бизнеса». Эта книга оказала влияние и на авторов двух других названных классических трудов[92].
Чандлер определил стратегию как «установление базовых долгосрочных целей и задач предприятия и выработку программы действий и распределения ресурсов, необходимой для реализации этих целей». Это определение активно используется до сих пор, хотя есть множество других, по-разному расставляющих акценты в отношении отдельных составляющих стратегии в зависимости от предпочтений авторов.
Например,[93]:
● Стратегия – это система (или план), интегрирующая основные цели организации, политику и последовательность действий в единое целое. Хорошо сформулированная стратегия помогает распределять и размещать ресурсы организации уникальным и эффективным образом, исходя из сферы компетенции и слабостей компании, предполагаемых изменений окружающей среды и внезапных действий умных противников.
● Стратегия – это принцип организации целей и задач, а также политика и планы для достижения этих целей и решения задач, сформулированные таким способом, чтобы определить, в какой сфере бизнеса находится или должна находиться компания и какой она является или должна являться.
● Чем занимается бизнес-стратегия, можно выразить двумя словами – конкурентным преимуществом. Единственная цель стратегического планирования состоит в том, чтобы помочь компании максимально эффективно добиться значимого превосходства над конкурентами. Корпоративная стратегия, таким образом, подразумевает попытку изменить силы компании в лучшую сторону по сравнению с ее конкурентами самым эффективным способом.
● Стратегия – это модель размещения ресурсов, которая позволяет организациям продолжать или совершенствовать свою деятельность.
Грант определил четыре общих фактора успешных стратегий (рис. 3.1).
● Цели, которые являются простыми, согласованными и долгосрочными.
● Глубокое понимание конкурентной среды.
● Объективная оценка ресурсов с целью эффективного использования сильных сторон и защиты уязвимых мест.
● Эффективное выполнение.
Разработку стратегии фирмы (а в более общем смысле любой другой организации) можно рассматривать как формирование связей между этой фирмой и внешней средой (рис. 3.2).
Фирма обладает тремя совокупностями основных характеристик:
● цели и ценности;
● ресурсы и способности;
● организационная структура и системы управления[94].
* Грант Р. М. Современный стратегический анализ. 5-е изд. / Пер. с англ., под ред. В. Н. Фунтова. – СПб.: Питер, 2008.
Внешняя среда фирмы включает в себя широкий диапазон экономических, социальных, политических и технологических факторов, которые влияют на принятие решений и ее деятельность. Однако для большинства стратегических решений ядром внешней среды является отрасль, определяющаяся отношениями с клиентами, конкурентами и поставщиками.
Задача стратегии состоит в том, чтобы установить, каким образом фирма воспользуется своими ресурсами в пределах окружающей среды (и достигнет своих долгосрочных целей) и как она организует себя, чтобы внедрить эту стратегию.
* Грант Р. М. Современный стратегический анализ. 5-е изд. / Пер. с англ., под ред. В. Н. Фунтова. – СПб.: Питер, 2008.