Пятничное изменение методики проведения некоторых опросов ВЦИОМ вызвало довольно заметную дискуссию как в профессиональном сообществе, так и просто в политизированных аудиториях. К сожалению, большинство комментариев так или иначе относились к политическим аспектам и мотивам данного решения: почему методика изменилась именно сейчас, как это повлияло на рейтинги власти, насколько корректно сравнивать новые данные со старыми рядами. Куда меньше внимания уделялось в целом кризису опросной социологии, который является не исключительно российским, а общемировым явлением. Начался он давно, задолго до полномасштабного развития нейросетей, вспомнить хотя бы шок 2016 года, когда большинство опросов отдавали уверенную победу Х.Клинтон. Современные же технологические вызовы еще сильнее обостряют ситуацию.
Кризис доверия
Опросный метод изначально построен на довольно хрупком фундаменте: незнакомый человек звонит или приходит к респонденту, представляется интервьюером, задает вопросы, а респондент соглашается потратить время и отвечает более или менее искренне. Сегодня на каждом этапе этой цепочки появились существенные проблемы.
Люди хуже отвечают на звонки с незнакомых номеров. Они справедливо опасаются мошенников, спамеров, а даже когда кто-то представляется интервьюером, напряжение сохраняется, вдруг это какая-то новая схема обмана, и за вопросом о том «как вы относитесь к власти» последует вопрос о цифрах из последнего СМС. Уверен, что с поквартирными опросами дела обстоят не лучше: многие и соседям своим боятся открывать, а тут и вовсе незнакомый человек с каверзными вопросами.
Недоверие к интервьюерам — это лишь частный случай общего кризиса доверия в обществе. Современный человек живет в пространстве, где информационный поток перенасыщен фейками, рекламой, политической пропагандой. В такой среде он начинает сомневаться не только в конкретном звонке, но и во всем вокруг опроса: кто спрашивает, зачем спрашивает, где окажется ответ, можно ли говорить откровенно, не будет ли это использовано против него.
В результате недоверие возникает на всех этапах. Люди не верят повестке, потому что боятся манипуляций. Люди не верят интервьюерам, потому что незнакомый голос в телефоне все чаще ассоциируется не с исследованием, а с риском. Люди не всегда верят даже себе: они сомневаются, есть ли у них устойчивое мнение или они лишь воспроизводят то, что недавно увидели в ленте соцсетей. Получается черный ящик Истона в кубе. Мы не знаем не только то, что происходит в самом ящике, но мы не уверены и в том, что было загружено на входе, и не понимаем, что мы получаем на выходе. Поэтому спор о конкретной методической рамке представляется малопродуктивным в условиях кризиса метода как такового.
Данные говорят больше
Параллельно существует и другой вызов — большие данные, которые мы вместе генерируем в ежедневном режиме. Все интереснее и продуктивнее становится анализ не того, что люди отвечают интервьюеру, а того, что они делают и говорят в цифровой среде, думая, что за ними не наблюдают. Посты, комментарии, поисковые запросы, реакции, репосты, подписки, просмотры, география перемещений, потребительское поведение, активность в мессенджерах и соцсетях — все это стало сырьем для анализа общественных настроений.
Опрос фиксирует ответы на вопросы, сформулированные и заданные исследователем. Большие данные фиксируют поведение, которое возникает без прямого вопроса. Человек может сказать, что не интересуется политикой, но ежедневно читать политические Telegram-каналы. Он может заявить, что поддерживает бойкот производителя или ресторана быстрого питания после какого-то резонансного скандала, но продолжать покупать товар и заказывать пиццу. Он может не признаться в тревоге, но начать искать информацию о курсе валют, мобилизации, релокации, антидепрессантах или способах обхода блокировок. Анализ поступков в этом смысле может быть продуктивнее, чем анализ слов респондента об этих поступках. Любимая фраза доктора Хауса Everybody lies идеально иллюстрирует эту проблему.
В политическом анализе это особенно важно, потому что общественное мнение состоит не только из декларируемых установок. Оно включает эмоциональные реакции, скрытые страхи, поведенческие ожидания, и целый спектр других эмоций. Опрос хорошо измеряет формализованную позицию: одобряю или не одобряю, доверяю или не доверяю, проголосовал бы или нет. Но цифровая среда лучше показывает динамику политпроцесса: какие темы внезапно становятся болезненными, какие аргументы лучше воспринимаются теми или иными ЦА, какие мемы стреляют, а какие — нет, где возникает раздражение, какие группы начинают говорить на одном языке.
Конечно, и здесь есть проблемы: боты, тролли, фейковая активность, инфошум, проблемы с алгоритмами, высокая ресурсоемкость сбора, хранения и обработки больших объемов данных, юридические и программные проблемы при попытках автоматизированного сбора данных. Но тем не менее область развивается. И даже если она не откусит кусок пирога социологов, потеснить их на рынке — может.
Социология без людей. ИИ и синтетические респонденты
Из проблем и возможностей, зафиксированных выше, возникает вполне логичная гипотеза: что если мы при помощи собранных данных о самых разных целевых аудиториях сможем сформировать идеального респондента под каждую ЦА, который всегда берет трубку, говорит только правду и доступен в режиме реального времени 24/7 для тестирования практически неограниченного набора предположений? На первый взгляд, это выглядит почти идеальным решением старых проблем опросной социологии.
Однако здесь возникает принципиальная методологическая проблема. ИИ-модель не имеет собственного социального опыта. Она не живет в малом городе, не боится потерять работу, не стоит в очереди в поликлинике, не разговаривает с соседями, не получает зарплату, не сталкивается с жадным полицейским или бесчувственным чиновником, не переживает политические события как собственную реальность. Не исключаю, что это можно смоделировать уже сейчас. Но уверен, что счет за такую симуляцию перекроет затраты на тысячи соцопросов.
Модель может производить вероятностный текст на основе массивов данных, на которых была обучена, и инструкций (промптов), которые ей дал пользователь. Поэтому синтетический респондент может убедительно имитировать социальную позицию, но не является носителем этой позиции.
Кроме того, синтетическая социология крайне чувствительна к настройкам. Достаточно немного изменить промпт, описание задачи, порядок вопросов или контекст, и модель может дать другой результат. Страдает верифицируемость результатов исследования, а критерий фальсифицируемости Поппера работает, но не так, как задумывалось знаменитым социологом — нейросеть придумает факты и из-за сбоя в алгоритме выдаст ошибочный результат.
Это не значит, что синтетические респонденты бесполезны. Их сфера применения на текущем этапе должна быть ограничена быстрым тестированием гипотез, но не более того. Однако и эта сфера в перспективе ударит по классической опросной социологии, так как технологии будут становиться все более совершенными и дешевыми.
Возвращаясь к теме изменения способа сбора данных в рамках опроса. В целом, не важно, какой клей вы собираетесь использовать для поклейки обоев в доме, если в нем горит крыша. Опросная социология нуждается в глубокой методологической, а не поверхностной методической дискуссии.
Михаил Карягин, заместитель директора Центра политической конъюнктуры.
Теги: ИИ, социология