Коллективный учебник-гайд от Колаборатории

Оглавление

Коллективный учебник-гайд
от Колаборатории

Работа с документами и качественный анализ данных в исследованиях международных отношений

Глава 4

Илона Стадник

Автор

Качественный анализ данных (QDA) является ключевым инструментом для исследователей международных отношений, позволяющим глубже понять сложные социальные, политические и культурные явления. В этой главе мы рассмотрим основные принципы QDA, методы сбора и организации данных, подходы к их анализу, а также роль цифровых инструментов и искусственного интеллекта в этом процессе.

1. Работа с документами
2. Какие данные необходимы для QDA?
3. Организация данных для анализа
4. Программное обеспечение для QDA

/01

Работа с документами

Когда речь заходит о проведении исследований в МО, в большей части случаев мы занимаемся именно качественными исследованиями. Что обычно делает международник при погружении в тематическое поле? Ищет релевантные статьи в научных базах, собирает тексты заявлений с сайтов МИД, читает официальные документы — например, внешнеполитические стратегии государств или резолюции ООН, — читает доклады мозговых центров, делает обзор публикаций СМИ и так далее.

Все это в совокупности собирается в массив источников, которые мы обрабатываем прежде всего как качественные данные — тексты, видео или аудиоматериалы. И здесь мы сталкиваемся с первой проблемой: нам нужно найти достаточный объем данных.

Какой объем может быть достаточным?

Объем собираемых данных зависит от цели и гипотезы вашего исследования, но для качественных данных справедливо утверждение, что чем их больше, тем лучше для анализа.

И тут мы обнаруживаем вторую проблему: как из этого неструктурированного массива документов, статей и других типов информации нам получить ответы на наш исследовательский вопрос. Предобработка и структурирование данных должны помочь в этом. Для этих целей как раз и служит QDA.

QDA — это процесс систематического изучения нечисловых данных (текстов, аудио, видео, изображений) для выявления закономерностей, тем и концепций. Его главная цель — обеспечить всестороннее понимание изучаемых явлений, учитывая социальные, культурные и исторические контексты.

Особенности QDA:

QDA предназначены для решения исследовательских вопросов, которые фокусируются на понимании «почему» и «как», а не просто на «что» или «сколько», на которые обычно пытаются ответить с помощью количественных методов.
QDA начинается со сбора данных, а затем предпринимается попытка разработать теории, концепции или темы, которые вытекают из этих данных.
QDA направлен на обеспечение всестороннего понимания изучаемых явлений путем рассмотрения социальных, культурных, исторических и других аспектов, которые формируют опыт и поведение акторов.
QDA является гибким и адаптируемым инструментом, что позволяет исследователям уточнять свои исследовательские вопросы, стратегии определения выборок данных или методы сбора данных по мере появления новых идей в процессе исследования.

/02

Какие данные необходимы для QDA?

Так как метод позаимствован из социологических наук, то классические данные — это интервью, фокус-группы, этнографические наблюдения. В зависимости от темы исследования, это все может быть релевантно и для МО. Типичные же источники для международников — это преимущественно документы и статьи (первичные и вторичные источники). Форма данных может быть любой: текст, видео, изображения, аудио.

Важно

Весь массив, который вы соберете, — многостраничные отчеты, десятки или сотни публикаций в СМИ или социальных сетях, дюжины документов — это сырые данные, из которых можно сделать только поверхностные выводы.

Важно

Весь массив, который вы соберете, — многостраничные отчеты, десятки или сотни публикаций в СМИ или социальных сетях, дюжины документов — это сырые данные, из которых можно сделать только поверхностные выводы.

/03

Организация данных для анализа

Неважно, как именно вы работаете с массивом данных, главное — сделать его систематизированным, подготовленным для более глубокого анализа.

Для этого существует две базовых стратегии:

Сокращение объема данных

Включает в себя сжатие данных с помощью обобщения или перефразирования. Это известная практика выделения ключевых идей, цитат, отрывков.

Кодирование

Данные классифицируются и маркируются по определенным критериям и категориям.

Код в контексте QDA представляет собой краткое изложение более крупного сегмента текста. Процесс кодирования различных фрагментов данных помогает исследователям увидеть, что происходит в их данных, и выявить возникающие аспекты и закономерности.

Подходы к кодированию данных

Индуктивное кодирование

Самая базовая форма, получение знаний с нуля. Индуктивное кодирование стремится генерировать информацию на основе самих качественных данных, а не с точки зрения применения каких-то имеющихся теорий и концепций.

Дедуктивное кодирование

Исследователь применяет набор предопределенных кодов, основанных на уже проведенных исследованиях, к новым данным.

Тематическое кодирование

Это организация мелких единиц в более крупные темы или подтемы. Это уже следующая ступень в QDA, когда мы начинаем видеть взаимосвязи внутри наших данных.

Часто индуктивное и дедуктивное кодирование комбинируются. Например, когда при изучении цифровой дипломатии мы ищем упоминания об использовании социальных сетей дипломатами, мы параллельно можем отмечать другие проявления этого феномена, которые нам встречаются в документах.

Важно отметить, что почти все качественные исследования в какой-то момент превращаются в количественные. Иначе как еще визуализировать наши данные и выводы? Визуализация помогает нам заметить совпадения и закономерности, которые мы не видим в сыром массиве данных. Например, частотность упоминания темы/феномена в исследуемых документах, сетевые графы между акторами, таймлайны событий.

Этот процесс сегодня можно автоматизировать и ускорить благодаря цифровым инструментам. Поговорим об этих инструментах, прежде чем показать, как кодирование и структурирование выглядят на практике.

/04

Программное обеспечение для QDA

Существует несколько программ, которые заточены под кодирование качественных данных и их дальнейшую визуализацию. Самые известные: MAXQDA и NVivo. Эти программы позволяют импортировать все ваши рабочие файлы — тексты, видео, изображения — структурировать их по группам, кластерам, а также размечать кодами, выделяя фрагменты текста.

Интерфейс программы MAXQDA

Интерфейс программы NVivo

Внутри ПО зашита возможность делать различные визуализации ваших данных: от простого облака слов до более сложных графов и таблиц с корреляциями.

Наиболее популярные типы визуализаций в QDA

Единственный минус такого ПО — его дороговизна. Лицензионные версии стоят очень дорого и зачастую финансово доступны только корпоративным заказчикам. Есть также варианты пиратских копий, которыми пользуются исследователи. (Мы не поддерживаем пиратство, но держим этот вариант в уме).

Альтернатива — бесплатные программы с облегченным функционалом, или же открытое ПО. Например, QDA Miner Lite. Для базового кодирования и последующего анализа данных такой версии вполне хватит.

Интерфейс программы QDA Miner Lite

/совет

Если нет возможности использовать ПО, не забывайте о простых способах: систематизация документов по папкам на компьютере, использование цветовых выделений в текстах (сделайте отдельный файл с цветовой легендой) или функции комментариев — как в doc, так и в pdf-файлах.

/совет

Если нет возможности использовать ПО, не забывайте о простых способах: систематизация документов по папкам на компьютере, использование цветовых выделений в текстах (сделайте отдельный файл с цветовой легендой) или функции комментариев — как в doc, так и в pdf-файлах.

Есть облачные решения, которые позволяют не приобретать дорогую лицензию, а оплачивать подписку на необходимый срок работы. Например, Atlas.ti. Но, в текущей ситуации при покупке услуг зарубежных сервисов из РФ могут возникать проблемы — учитывайте это при работе.

Ниже пример использования Atlas.ti на основе массива из американских стратегий, связанных с кибербезопасностью. Массив уже сокращен до ключевых фраз в каждом документе, относящихся к видам киберугроз.

Визуализация частоты упоминания тех или иных типов угроз

Матрица корреляций между упоминаниями разных типов угроз

Кодирование документа

Визуализация частоты упоминания тех или иных типов угроз

(цветом выделены более широкие тематические группы)

Матрица корреляций между упоминаниями разных типов угроз

/05

Использование ИИ для QDA

Для кодирования сырого массива данных можно попробовать воспользоваться возможностями генеративных нейросетей: ChatGPT или DeepSeek.

Промпт для ручного кодирования текста

/промпт

Задача: Проведи качественное кодирование предоставленного текста на основе следующих инструкций.

1. Контекст исследования
Цель анализа: [Впиши цель, например: «выявить барьеры в использовании ИИ в дипломатической работе»]
Тип данных: [интервью/ответы на открытые вопросы / фокус-группы / соцсети / доклады]
Единица анализа: [отдельные предложения / абзацы / полные реплики]

2. Кодовая схема
Используй эти категории и подкоды (дополни или измени):
Тема 1 (например, «Технические проблемы»):

Подкод 1.1: «Нехватка оборудования»
Подкод 1.2: «Низкая скорость интернета»

Тема 2 («Организационные барьеры»):

Подкод 2.1: «Отсутствие поддержки руководства»
Подкод 2.2: «Нехватка времени»

Тема 3 («Эмоциональные реакции»):

Подкод 3.1: «Страх изменений»
Подкод 3.2: «Энтузиазм»

[Добавь свои коды или попроси ИИ предложить их на основе текста]

3. Инструкции по кодированию
Внимательно прочитай текст, разбивая его на смысловые единицы. Для каждой единицы:

Выдели ключевую идею.
Присвой подходящий код/подкод (или создай новый, если нужно).
Объясни выбор кода (1−2 предложения).

Если фрагмент содержит несколько тем, разметь их все. Не интерпретируй скрытый смысл без явных указаний в тексте.

4. Формат вывода
Представь разметку в табличном виде:

Текст (фрагмент)	Код	Подкод	Комментарий
«У нас нет денег на закупку серверов…»	Технические проблемы	Нехватка оборудования	Прямое упоминание отсутствия ресурсов
«Директор говорит, что это не приоритет…»	Организационные барьеры	Отсутствие поддержки руководства	Указание на позицию администрации

[Дополнительные пожелания: выделение цитат, подсчет частоты кодов и т. д.]

5. Текст для анализа
[Вставь сюда текст для кодирования]

Как использовать промпт?

Заполни контекст и кодовую схему перед отправкой в чат.

Если коды неизвестны, попроси:
[Проанализируй текст и предложи предварительную кодовую схему, 3−5 тем с примерами]

Для сложных данных уточняй:
[Учитывай не только явные утверждения, но и метафоры, контекстные противоречия]

Какие проблемы могут возникнуть?

При использовании ИИ в кодировании всегда стоит помнить, что результат может получиться нерелевантным. Одна из частых проблем — «кодовый шум», который генерирует алгоритм при анализе текста.

Так выглядит кодовый шум в Atlas.ti при использовании функции ИИ при кодировании

Также не всегда можно отследить, на какие смысловые единицы был разбит документ при кодировании, и не утерян ли контекст. Поэтому ИИ можно использовать как стартовую точку при индуктивном кодировании, но обязательно вручную перепроверить хотя бы на небольшой выборке документов, что его кодирование соответствует действительности. Либо ускорить процесс дедуктивного кодирования, когда вы точно знаете, что ищете в своих сырых данных для вашего исследования.

QDA является мощным методом для исследователей международных отношений, позволяющим раскрывать глубинные причины событий и поведение акторов. Несмотря на развитие цифровых технологий, ключевую роль играет критическое мышление исследователя: даже самые продвинутые алгоритмы не заменят человеческую интерпретацию.

Практикум

Каковы основные цели качественного анализа данных (QDA) в исследованиях международных отношений?
Какие типы данных чаще всего используются в QDA для анализа международных отношений?
В чем разница между индуктивным и дедуктивным кодированием данных?
Какие цифровые инструменты могут помочь в качественном анализе данных, каковы их преимущества и ограничения?
Как можно использовать искусственный интеллект для кодирования данных, и какие риски с этим связаны?