Дарья Моисеева
Автор
Качественный анализ данных (QDA) является ключевым инструментом для исследователей международных отношений, позволяющим глубже понять сложные социальные, политические и культурные явления. В отличие от количественных методов, которые отвечают на вопросы «что» и «сколько», QDA фокусируется на «почему» и «как», раскрывая контекст и механизмы взаимодействия акторов на мировой арене.
В этой главе мы рассмотрим основные принципы QDA, методы сбора и организации данных, подходы к их анализу, а также роль цифровых инструментов и искусственного интеллекта в этом процессе.
Работа с документами
Когда речь заходит о проведении исследований в МО, в большей части случаев мы занимаемся именно качественными исследованиями. Что обычно делает международник при погружении в тематическое поле? Ищет релевантные статьи в научных базах, собирает тексты заявлений с сайтов МИД, читает официальные документы — например, внешнеполитические стратегии государств или резолюции ООН, — читает доклады мозговых центров, делает обзор публикаций СМИ и так далее.
Все это в совокупности собирается в массив источников, которые мы обрабатываем прежде всего как качественные данные — тексты, видео или аудиоматериалы. И здесь мы сталкиваемся с первой проблемой: нам нужно найти достаточный объем данных. Какой объем может быть достаточным?
Объем собираемых данных зависит от цели и гипотезы вашего исследования, но для качественных данных справедливо утверждение, что чем их больше, тем лучше для анализа.
И тут мы обнаруживаем вторую проблему: как из этого неструктурированного массива документов, статей и других типов информации нам получить ответы на наш исследовательский вопрос. Предобработка и структурирование данных должны помочь в этом. Для этих целей как раз и служит QDA.
QDA — это процесс систематического изучения нечисловых данных (текстов, аудио, видео, изображений) для выявления закономерностей, тем и концепций. Его главная цель — обеспечить всестороннее понимание изучаемых явлений, учитывая социальные, культурные и исторические контексты.
  • Качественные исследования предназначены для решения исследовательских вопросов, которые фокусируются на понимании «почему» и «как», а не просто на «что» или «сколько», на которые обычно пытаются ответить с помощью количественных методов.
  • QDA начинается со сбора данных, а затем предпринимается попытка разработать теории, концепции или темы, которые вытекают из этих данных
  • QDA направлен на обеспечение всестороннего понимания изучаемых явлений путем рассмотрения социальных, культурных, исторических и других аспектов, которые формируют опыт и поведение акторов.
  • QDA является гибким и адаптируемым инструментом, что позволяет исследователям уточнять свои исследовательские вопросы, стратегии определения выборок данных или методы сбора данных по мере появления новых идей в процессе исследования.

Какие данные мы обычно собираем для QDA?
Так как метод позаимствован из социологических наук, то классические данные — это интервью, фокус-группы, этнографические наблюдения. В зависимости от темы исследования, это все может быть релевантно и для МО. Типичные же источники для международников — это преимущественно документы и статьи (первичные и вторичные источники). Форма данных может быть любой: текст, видео, изображения, аудио.
  • Важно
    Весь массив, который вы соберете, — многостраничные отчеты, десятки или сотни публикаций в СМИ или социальных сетях, дюжины документов — это сырые данные, из которых можно сделать только поверхностные выводы.
Важно
Весь массив, который вы соберете, — многостраничные отчеты, десятки или сотни публикаций в СМИ или социальных сетях, дюжины документов — это сырые данные, из которых можно сделать только поверхностные выводы.

Организация данных для анализа
Неважно, как именно вы работаете с массивом данных, главное — сделать его систематизированным, подготовленным для более глубокого анализа.
Для этого существует две базовых стратегии:
  • Сокращение объема данных — включает в себя сжатие данных с помощью обобщения или перефразирования. Это известная практика выделения ключевых идей, цитат, отрывков.
  • Кодирование — данные классифицируются и маркируются по определенным критериям и категориям.
Код в контексте QDA представляет собой краткое изложение более крупного сегмента текста. Процесс кодирования различных фрагментов данных помогает исследователям увидеть, что происходит в их данных, и выявить возникающие аспекты и закономерности.
Подходы к кодированию данных:
  • Индуктивное кодирование — самая базовая форма, получение знаний с нуля. Индуктивное кодирование стремится генерировать информацию на основе самих качественных данных, а не с точки зрения применения каких-то имеющихся теорий и концепций
  • Дедуктивное кодирование — исследователь применяет набор предопределенных кодов, основанных на уже проведенных исследованиях, к новым данным.
Часто оба эти подхода комбинируются. Например, когда при изучении цифровой дипломатии мы ищем упоминания об использовании социальных сетей дипломатами, мы параллельно можем отмечать другие проявления этого феномена, которые нам встречаются в документах.
Также существует тематическое кодирование — организация мелких единиц в более крупные темы или подтемы. Это уже следующая ступень в QDA, когда мы начинаем видеть взаимосвязи внутри наших данных.
Важно отметить, что почти все качественные исследования в какой-то момент превращаются в количественные. Иначе как еще визуализировать наши данные и выводы? Визуализация помогает нам заметить совпадения и закономерности, которые мы не видим в сыром массиве данных. Например, частотность упоминания темы/феномена в исследуемых документах, сетевые графы между акторами, таймлайны событий.
Этот процесс сегодня можно автоматизировать и ускорить благодаря цифровым инструментам. Поговорим об этих инструментах, прежде чем показать, как кодирование и структурирование выглядят на практике.

Программное обеспечение для QDA
Существует несколько программ, которые заточены под кодирование качественных данных и их дальнейшую визуализацию. Самые известные: MAXQDA и NVivo. Эти программы позволяют импортировать все ваши рабочие файлы — тексты, видео, изображения — структурировать их по группам, кластерам, а также размечать кодами, выделяя фрагменты текста.
Внутри ПО зашита возможность делать различные визуализации ваших данных: от простого облака слов до более сложных графов и таблиц с корреляциями. Единственный минус такого ПО — его дороговизна.
Спойлер: Лицензионные версии стоят очень дорого и зачастую финансово доступны только корпоративным заказчикам (есть также варианты пиратских копий, которыми пользуются исследователи. Мы не поддерживаем пиратство, но держим этот вариант в уме).
Альтернатива — бесплатные программы с облегченным функционалом, или же открытое ПО. Например, QDA Miner Lite. Для базового кодирования и последующего анализа данных такой версии вполне хватит.
  • Совет
    Если нет возможности использовать ПО, не забывайте о простых способах: систематизация документов по папкам на компьютере, использование цветовых выделений в текстах (сделайте отдельный файл с цветовой легендой, чтобы не забыть, что вы помечаете) или функции комментариев — как в doc, так и в pdf-файлах.
Совет
Если нет возможности использовать ПО, не забывайте о простых способах: систематизация документов по папкам на компьютере, использование цветовых выделений в текстах (сделайте отдельный файл с цветовой легендой, чтобы не забыть, что вы помечаете) или функции комментариев — как в doc, так и в pdf-файлах.
Есть облачные решения, которые позволяют не приобретать дорогую лицензию, а оплачивать подписку на необходимый срок работы. Например, Atlas.ti. Но, в текущей ситуации при покупке услуг зарубежных сервисов из РФ могут возникать проблемы — учитывайте это при работе.
Ниже пример использования Atlas. ti на основе массива из американских стратегий, связанных с кибербезопасностью. Массив уже сокращен до ключевых фраз в каждом документе, относящихся к видам киберугроз.

Использование ИИ для QDA
Для кодирования сырого массива данных можно попробовать воспользоваться возможностями генеративных нейросетей: ChatGPT или DeepSeek. Запросы могут быть сформулированы как для кодирования по уже имеющейся кодовой схеме (дедуктивное кодирование), так и для выявления новых тематических единиц (индуктивное кодирование).
Как использовать промпт?
При использовании ИИ в кодировании всегда стоит помнить, что результат может получиться нерелевантным. Одна из частых проблем — «кодовый шум», который генерирует алгоритм при анализе текста.
Также не всегда можно отследить, на какие смысловые единицы был разбит документ при кодировании, и не утерян ли контекст. Поэтому ИИ можно использовать как стартовую точку при индуктивном кодировании, но обязательно вручную перепроверить хотя бы на небольшой выборке документов, что его кодирование соответствует действительности. Либо ускорить процесс дедуктивного кодирования, когда вы точно знаете, что ищете в своих сырых данных для вашего исследования.

Практикум