Коллективный учебник-гайд
от Колаборатории
/01

Работа с документами

Когда речь заходит о проведении исследований в МО, в большей части случаев мы занимаемся именно качественными исследованиями. Что обычно делает международник при погружении в тематическое поле? Ищет релевантные статьи в научных базах, собирает тексты заявлений с сайтов МИД, читает официальные документы — например, внешнеполитические стратегии государств или резолюции ООН, — читает доклады мозговых центров, делает обзор публикаций СМИ и так далее.
Все это в совокупности собирается в массив источников, которые мы обрабатываем прежде всего как качественные данные — тексты, видео или аудиоматериалы. И здесь мы сталкиваемся с первой проблемой: нам нужно найти достаточный объем данных.

Какой объем может быть достаточным?

Объем собираемых данных зависит от цели и гипотезы вашего исследования, но для качественных данных справедливо утверждение, что чем их больше, тем лучше для анализа.
И тут мы обнаруживаем вторую проблему: как из этого неструктурированного массива документов, статей и других типов информации нам получить ответы на наш исследовательский вопрос. Предобработка и структурирование данных должны помочь в этом. Для этих целей как раз и служит QDA.
QDA — это процесс систематического изучения нечисловых данных (текстов, аудио, видео, изображений) для выявления закономерностей, тем и концепций. Его главная цель — обеспечить всестороннее понимание изучаемых явлений, учитывая социальные, культурные и исторические контексты.
Особенности QDA:
  • QDA предназначены для решения исследовательских вопросов, которые фокусируются на понимании «почему» и «как», а не просто на «что» или «сколько», на которые обычно пытаются ответить с помощью количественных методов.
  • QDA начинается со сбора данных, а затем предпринимается попытка разработать теории, концепции или темы, которые вытекают из этих данных.
  • QDA направлен на обеспечение всестороннего понимания изучаемых явлений путем рассмотрения социальных, культурных, исторических и других аспектов, которые формируют опыт и поведение акторов.
  • QDA является гибким и адаптируемым инструментом, что позволяет исследователям уточнять свои исследовательские вопросы, стратегии определения выборок данных или методы сбора данных по мере появления новых идей в процессе исследования.

/02

Какие данные необходимы для QDA?

Так как метод позаимствован из социологических наук, то классические данные — это интервью, фокус-группы, этнографические наблюдения. В зависимости от темы исследования, это все может быть релевантно и для МО. Типичные же источники для международников — это преимущественно документы и статьи (первичные и вторичные источники). Форма данных может быть любой: текст, видео, изображения, аудио.
  • Важно
    Весь массив, который вы соберете, — многостраничные отчеты, десятки или сотни публикаций в СМИ или социальных сетях, дюжины документов — это сырые данные, из которых можно сделать только поверхностные выводы.
Важно
Весь массив, который вы соберете, — многостраничные отчеты, десятки или сотни публикаций в СМИ или социальных сетях, дюжины документов — это сырые данные, из которых можно сделать только поверхностные выводы.

/03

Организация данных для анализа

Неважно, как именно вы работаете с массивом данных, главное — сделать его систематизированным, подготовленным для более глубокого анализа.
Для этого существует две базовых стратегии:
  • Сокращение объема данных
    Включает в себя сжатие данных с помощью обобщения или перефразирования. Это известная практика выделения ключевых идей, цитат, отрывков.
  • Кодирование
    Данные классифицируются и маркируются по определенным критериям и категориям.
Код в контексте QDA представляет собой краткое изложение более крупного сегмента текста. Процесс кодирования различных фрагментов данных помогает исследователям увидеть, что происходит в их данных, и выявить возникающие аспекты и закономерности.

Подходы к кодированию данных

  • Индуктивное кодирование
Самая базовая форма, получение знаний с нуля. Индуктивное кодирование стремится генерировать информацию на основе самих качественных данных, а не с точки зрения применения каких-то имеющихся теорий и концепций.
  • Дедуктивное кодирование
Исследователь применяет набор предопределенных кодов, основанных на уже проведенных исследованиях, к новым данным.
  • Тематическое кодирование
Это организация мелких единиц в более крупные темы или подтемы. Это уже следующая ступень в QDA, когда мы начинаем видеть взаимосвязи внутри наших данных.
Часто индуктивное и дедуктивное кодирование комбинируются. Например, когда при изучении цифровой дипломатии мы ищем упоминания об использовании социальных сетей дипломатами, мы параллельно можем отмечать другие проявления этого феномена, которые нам встречаются в документах.
Важно отметить, что почти все качественные исследования в какой-то момент превращаются в количественные. Иначе как еще визуализировать наши данные и выводы? Визуализация помогает нам заметить совпадения и закономерности, которые мы не видим в сыром массиве данных. Например, частотность упоминания темы/феномена в исследуемых документах, сетевые графы между акторами, таймлайны событий.
Этот процесс сегодня можно автоматизировать и ускорить благодаря цифровым инструментам. Поговорим об этих инструментах, прежде чем показать, как кодирование и структурирование выглядят на практике.

/04

Программное обеспечение для QDA

Существует несколько программ, которые заточены под кодирование качественных данных и их дальнейшую визуализацию. Самые известные: MAXQDA и NVivo. Эти программы позволяют импортировать все ваши рабочие файлы — тексты, видео, изображения — структурировать их по группам, кластерам, а также размечать кодами, выделяя фрагменты текста.
Интерфейс программы MAXQDA
Интерфейс программы NVivo
Внутри ПО зашита возможность делать различные визуализации ваших данных: от простого облака слов до более сложных графов и таблиц с корреляциями.
Наиболее популярные типы визуализаций в QDA
Единственный минус такого ПО — его дороговизна. Лицензионные версии стоят очень дорого и зачастую финансово доступны только корпоративным заказчикам. Есть также варианты пиратских копий, которыми пользуются исследователи. (Мы не поддерживаем пиратство, но держим этот вариант в уме).
Альтернатива — бесплатные программы с облегченным функционалом, или же открытое ПО. Например, QDA Miner Lite. Для базового кодирования и последующего анализа данных такой версии вполне хватит.
Интерфейс программы QDA Miner Lite
  • /совет

    Если нет возможности использовать ПО, не забывайте о простых способах: систематизация документов по папкам на компьютере, использование цветовых выделений в текстах (сделайте отдельный файл с цветовой легендой) или функции комментариев — как в doc, так и в pdf-файлах.
/совет
Если нет возможности использовать ПО, не забывайте о простых способах: систематизация документов по папкам на компьютере, использование цветовых выделений в текстах (сделайте отдельный файл с цветовой легендой) или функции комментариев — как в doc, так и в pdf-файлах.
Есть облачные решения, которые позволяют не приобретать дорогую лицензию, а оплачивать подписку на необходимый срок работы. Например, Atlas.ti. Но, в текущей ситуации при покупке услуг зарубежных сервисов из РФ могут возникать проблемы — учитывайте это при работе.
Ниже пример использования Atlas. ti на основе массива из американских стратегий, связанных с кибербезопасностью. Массив уже сокращен до ключевых фраз в каждом документе, относящихся к видам киберугроз.

/05

Использование ИИ для QDA

Для кодирования сырого массива данных можно попробовать воспользоваться возможностями генеративных нейросетей: ChatGPT или DeepSeek.

Как использовать промпт?

  • Заполни контекст и кодовую схему перед отправкой в чат.
  • Если коды неизвестны, попроси:
    [Проанализируй текст и предложи предварительную кодовую схему, 3−5 тем с примерами]
  • Для сложных данных уточняй:
    [Учитывай не только явные утверждения, но и метафоры, контекстные противоречия]

Какие проблемы могут возникнуть?

При использовании ИИ в кодировании всегда стоит помнить, что результат может получиться нерелевантным. Одна из частых проблем — «кодовый шум», который генерирует алгоритм при анализе текста.
Так выглядит кодовый шум в Atlas.ti при использовании функции ИИ при кодировании
Также не всегда можно отследить, на какие смысловые единицы был разбит документ при кодировании, и не утерян ли контекст. Поэтому ИИ можно использовать как стартовую точку при индуктивном кодировании, но обязательно вручную перепроверить хотя бы на небольшой выборке документов, что его кодирование соответствует действительности. Либо ускорить процесс дедуктивного кодирования, когда вы точно знаете, что ищете в своих сырых данных для вашего исследования.
QDA является мощным методом для исследователей международных отношений, позволяющим раскрывать глубинные причины событий и поведение акторов. Несмотря на развитие цифровых технологий, ключевую роль играет критическое мышление исследователя: даже самые продвинутые алгоритмы не заменят человеческую интерпретацию.
Практикум
Ответьте на вопросы для закрепления материала

Хотите больше узнать по теме? Ознакомьтесь с данной литературой

Издательство «Координационная лаборатория», г. Санкт-Петербург
ISBN 978-5-6054566-0-5