Марсиу де Миранда Сантуш: анализ больших данных важен для согласования «точек старта» в будущее
Марсиу де Миранда Сантуш, исполнительный директор Центра стратегических исследований и управления в области науки, технологий и инноваций (Бразилия), в докладе на Форсайт-конференции рассказал о новых инструментах мониторинга и анализа глобальных национальных трендов в области науки, технологий и инноваций. Представленные средства позволяют собирать, обрабатывать большие объемы данных, а также распространять проанализированную информацию между участниками форсайт-исследований. Некоторые инструменты были разработаны в сотрудничестве с Форсайт-центром Высшей школы экономики.
О Центре стратегических исследований и управления в области науки, технологий и инноваций.
Центр создан в 2001 году, имеет статус некоммерческой организации, исследует факторы экономического роста и обеспечения конкурентоспособности и благосостояния в Бразилии. С начала образования центр выполнил около 400 исследований в области научно-технической и инновационной политики по заказу бразильского правительства, а также других организаций, в том числе из зарубежных стран. Ряд проектов были реализованы совместно с национальным Министерством науки, технологий и инноваций, государственными и частными исследовательскими институтами. Постоянный штат составляет 90 человек. Для выполнения масштабных работ центр мобилизует большие экспертные силы: в течение года на его площадках собираются в среднем до двух тысяч человек из 300 институтов страны и из-за рубежа.
Зачем инвестировать в новые инструменты анализа больших объемов информации?
По ряду проектов специалисты CGEE заметили, как эти инструменты позволяют мобилизовать знания лучших экспертов в стране и за ее пределами, повышать уровень прогнозирования, следить за изменениями в сфере науки и технологий и в целом наращивать потенциал исследовательской организации. Данные мониторинга и анализа трендов напрямую влияют на качество, оперативность и обоснованность управленческих решений.
Марсиу де Миранда Сантуш: «Мы наблюдали практически в начале каждого исследования ту ситуацию, когда все участники, вроде, готовы двигаться в будущее, однако собираются это делать в разных направлениях. Замечая, как сильно разнится видение одного человека от точки зрения и направления другого, я стал понимать: насколько сложно для человечества двигаться вперед».
Неопределенность присутствует в любой ситуации, мнения людей редко совпадают, и очень важно давать правильную оценку тому, где мы сейчас находимся, и позволить аналитикам и экспертам это прокомментировать, возможно, представить наилучшие направления, выделить отправную точку для движения вперед.
Чтобы получить такую оценку, бывает необходимо за некий период переварить тысячи статей, тысячи килобайт информации из различных компаний, институтов, журналов, других источников. Нарастающие в процессе этого обзора объемы данных еще надо классифицировать и доступно представить, визуализировать.
С помощью сформированной в CGEE базовой платформы (Рис. 2) специалисты центра могут перерабатывать и извлекать большие объемы текстовой информации, находить сходные элементы, ключевые аспекты и графически обрабатывать эту информацию. В рамках одной таксономии система в среднем анализирует 40 тысяч текстов из разных источников. Вопрос, как эти данные организовать, чтобы определить, что происходит или что произойдет в будущем, и был, собственно, причиной, почему центр CGEE разработал такую информационную систему.
Для чего используется платформа. На примерах
CGEE оказывает поддержку бразильскому правительству в оценке и мониторинге реализации крупных программ в сфере научно-технической и инновационной политики, а также анализе деятельности национальных сетей исследовательских организаций. По результатам этой оценки зачастую вносятся коррективы в бюджетное финансирование научных коллективов.
Посредством комбинирования открытого и корпоративного ПО и анализа различных баз данных, в частности базы резюме национальных экспертов (объемом порядка 4,4 миллиона резюме), CGEE отслеживает динамику развития партнерских связей в исследовательских сетях Бразилии. За счет стимулирования коллабораций с опорой на полученные центром данные показатель сотрудничества между учеными вырос с 4,5 (за период 2001—2007 гг.) до 5,2 (в 2008—2013 гг.). Анализ информации также показал, что с урезанием бюджетного финансирования снижаются и показатели сотрудничества.
Информационная платформа дает представление об уровне партнерства между учеными из разных стран. Так, накануне поездки в Москву исследователи из CGEE попытались определить, какие российские ученые и центры сотрудничают с бразильскими в области математических наук. Буквально за несколько минут, при нулевых затратах, выявили ключевые направления совместных исследований России и Бразилии, а также участвующие в них коллективы и научные организации.
Некоторые инструменты анализа больших данных бразильские коллеги улучшили после совместного семинара в НИУ ВШЭ и, в частности, благодаря подключению Максима Коцемира, предоставившего специалистам из CGEE метаданные по совместным публикациям российских и бразильских исследователей в области математических наук, индексируемым в Scopus и Web of Science.
Полная презентация доклада Марсиу де Миранда Сантуша доступна по ссылке (PDF, 1.96 Мб).
Подготовила Елена Гутарук