Встречаем 2025-й долгожданным интервью о будущем. Наш герой — Иван Бибилов, технический директор программы прикладного анализа данных (ПАНДАН) Школы вычислительных социальных наук, созданной в партнерстве Яндекс Образованием и Европейским университетом.
Говорим о примерах, где технологии переплетаются с человеческой памятью и наследием. От первого лица — про перспективы для исследователей.
За 40 минут вы услышите ответы на вопросы о вызовах цифровизации, зарубежных примерах, текущих проектах (например, распознавании гербов) и, конечно, о роли исследователей на фоне растущего влияния технологий.
О междисциплинарности
И у социологии, и у политологии, и у журналистики, и у истории есть устоявшиеся подходы к обработке данных. Да, существует инженерно-технический стек, который в последнее время ушел далеко вперед, и хочется постоянно исследовать интерференцию, избегая надменного взгляда с обеих сторон.
Делить людей условно на технарей и гуманитариев — это пошлый и давно устаревший подход. Среди исследователей так уже давно не делают. Однако, если всё же разделить на две группы, то с одной стороны будет скепсис, а с другой — технооптимизм.
О недоверии к ИИ
Как мы можем формулировать исследовательские вопросы, чтобы получать ссылки на факты — откуда это взято? У исследователей часто возникает большое недоверие из-за того, что нейросети воспринимаются как черный ящик.
Правило успешного результата
Если говорить: «Разойдитесь, сейчас мы все сделаем, а вы, глупенькие, просто дайте нам базу данных», — такой подход обречен, потому что выводы будут ничтожны. Все получается только тогда, когда обе стороны начинают взаимодействовать: «А что нужно? Как мы будем тестировать? Что для вас является доказательством, а что — исследовательским вопросом?»
Важно не просто поболтать в чате, а наладить полноценное взаимодействие с данными. Сейчас перед нами стоит такая большая задача.
Зарубежный опыт
Мне не хватает осмысленного проекта внутри России, связанного с сохранением данных в интернете. Нечто централизованное, как archive.org. Иначе историки будут с удивлением обнаруживать, что ничего из данных не сохранилось. Единственный способ узнать, что сайт существовал, — это найти книгу, где он был упомянут.
Проблема цифровизации
Мы живем в условиях цифровой «горящей библиотеки». Любой сайт и любая информация на нем прямо или косвенно зависят от финансирования. Поддержка данных не может продолжаться вечно.
Генеалогия будущего
Технологии есть, но сами по себе они ничего не решат. Важно понять, как адаптировать их для исследователей, которые будут работать с данными не как обычные пользователи, стремящиеся найти книгу или написать текст, а как профессионалы, задающие глубокие вопросы.
Программирование в работе исследователей
Кажется, что роль исследователя неизбежна, и он никуда не исчезнет. Более того, исследователю не всегда понадобится программист. Многие задачи программирования уже носят рутинный характер.
Личный опыт изучения родословной
Мой взгляд здесь обывательский: я боюсь работать с архивами, потому что не понимаю, как они устроены. Какие данные они могут предоставить? Могу ли я запросить сканы? Для меня стало открытием, что у разных архивов — разные правила. Однако пример Госуслуг показывает, как можно объединять разрозненные базы данных в эффективную систему.