Большие данные для ИИ
Институт статистических исследований и экономики знаний НИУ ВШЭ продолжает изучать решения и практики, связанные с технологиями искусственного интеллекта (ИИ), и анализирует масштабы использования при их внедрении массивов больших данных (МБД), а также обеспеченность пользователей МБД необходимым для их обработки оборудованием, кадрами и компетенциями.
Сами по себе массивы больших данных мало применимы для использования — для их обработки требуются специальные инструменты, которые предоставляют прежде всего технологии искусственного интеллекта. В свою очередь, для функционирования этих технологий и обучения моделей на основе ИИ необходимы большие данные. Именно тандем больших данных и ИИ-технологий становится ресурсом, позволяющим оптимизировать работу организаций, предлагать на рынке новые продукты и услуги.
В какой мере большие данные востребованы российскими компаниями для работы ИИ? Результаты специализированного обследования показали, что среди организаций, работающих с технологиями искусственного интеллекта, 28,6% используют в своей деятельности массивы больших данных и только 9,8% применяют МБД именно в целях работы с ИИ (рис. 1).
Компании пока не очень активно применяют МБД для внедрения и использования технологий ИИ. Это прослеживается в большинстве видов экономической деятельности, за исключением сектора информации и связи. Так, организации, работающие в области связи на базе беспроводных технологий, используют МБД в сочетании с технологиями ИИ для управления сетями, оптимизации их пропускной способности и обеспечения безопасности. Прочим информационным службам, к ним, например, относятся колл-центры, ИИ-решения помогают обрабатывать звонки и сообщения, повышать качество обслуживания и анализировать поведение клиентов, предсказывать их потребности.
Барьеры в использовании больших данных для ИИ
Использование МБД для работы с технологиями ИИ сдерживается целым рядом факторов. Наиболее значимые среди них — дефицит квалифицированного персонала в предметной области (выделяют 64,9% обследованных организаций, задействовавших ИИ и МБД), сложности интеграции технологий ИИ в производственные и бизнес-процессы (51,7%), нехватка массивов данных для использования ИИ (49,9%). Примечательно, что недостатки данных для применения технологий ИИ (неструктурированность, пропуски и др.) упоминаются реже всего: эту проблему отметили 36,4% организаций — пользователей ИИ и МБД (рис. 2).
Хранение и обработка больших данных
Для хранения и обработки больших данных обследованные компании в основном задействуют облачные сервисы, системы хранения данных, серверы (не объединенные в кластеры) или центры обработки данных. О применении суперкомпьютеров сообщили только 2,6% организаций — пользователей МБД.
Массивы больших данных могут храниться с использованием как собственных, так и арендуемых мощностей. Результаты обследования показали, что большинство работающих с МБД организаций полагаются только на собственные хранилища. Прежде всего это относится к крупным (76,2%) и средним (64,1%) компаниям — пользователям МБД. Среди малых предприятий эта доля намного ниже — 39,4% (рис. 3).
Такие закономерности использования собственных и арендуемых хранилищ обусловлены различными подходами к управлению данными. Наличие собственных мощностей обеспечивает крупным и средним организациям максимальный контроль над ИТ-инфраструктурой, автономию в принятии решений и возможность оперативно адаптировать связанные с МБД бизнес-процессы под новые задачи. Малые предприятия чаще отдают предпочтение арендуемым мощностям, что позволяет им масштабировать объемы необходимых данных, минимизируя таким образом затраты на использование и поддержку оборудования.
Компетенции в работе с большими данными
Для эффективной работы с массивами больших данных необходимы профильные знания и навыки, а в масштабе организаций — системные решения в сфере подготовки соответствующих кадров.
Подавляющее большинство (75,6%) опрошенных организаций, использующих МБД, имеют в штате кадры, обладающие соответствующими компетенциями, и проводят аналитику больших данных силами своих сотрудников, не доверяя ее внешним контрагентам. Еще 14,7% испытывают нехватку внутренних ресурсов и привлекают как собственных сотрудников, так и специалистов других компаний. Полностью делегируют аналитику больших данных сторонним фирмам только 9,7% респондентов, что может свидетельствовать как о недостаточном уровне компетенций в организациях, так и об осознанной стратегии привлечения специализированных кадров, развитие которых внутри компании нецелесообразно (рис. 4).
Показательно, что 4,6% обследованных организаций, использующих в своей деятельности МБД, не занимаются аналитикой больших данных. Причина здесь — как в отсутствии нужных ресурсов и навыков, так и в неочевидности для компаний дополнительных бизнес-эффектов от проведения подобной аналитики. Для этого пула организаций катализатором повышения эффективности работы с данными могут стать именно технологии искусственного интеллекта. На стыке ИИ-решений и инструментов анализа МБД формируются возможности не только эффективной обработки данных, но и их преобразования в ценные новые знания, обеспечивающие принятие взвешенных управленческих решений, оптимизацию бизнес-процессов, ускорение инноваций, что в будущем может привести к трансформации целых отраслей.
Предыдущий выпуск серии «Искусственный интеллект»:
«От фантастики к реальности: ИИ в руках населения»
См. также: