Добавлена новая вакансия Vacancy_name
Назад

К. Нигматулина-Мащицкая о видах математических моделей и рабочей группе РАН

Дата публикации: 01 июня 2020

К. Нигматулина-Мащицкая о видах математических моделей и рабочей группе РАН

Борьба с пандемией коронавируса уже несколько месяцев охватила весь мир. Ученые из разных профессиональных областей изо дня в день ищут способы, которые помогут людям вернуться к полноценному образу жизни. В интервью «Научной России» профессор РАН Карима Робертовна Нигматулина-Мащицкая рассказала о том, как работает и что обсуждает в эти месяцы рабочая группа при Российской академии наук по вопросам борьбы сCOVID-19, какие бывают виды математических моделей и как они могут помочь остановить распространение пандемии.

Вы говорили в своем выступлении в МИА «Россия сегодня», что в феврале стало ясно – пандемия придет в Россию. Каким образом Вы это поняли?

В этом вопросе очень важно уточнить терминологию, потому что я знала, что COVID-19 точно проникнет в России, но то, что это будет пандемия – признаюсь, этого я не знала.

Пандемия подразумевает, что вирус широко распространяется среди населения, и нужно понимать – в первых числах февраля было неочевидно, что заболевание будет так масштабно распространяться среди населения и то, что большое количество людей будет заражаться. Зимой было известно, что в Китае достаточно много больных – уже тысячи человек.

Мы можем понимать из некоторых математических выкладок, что, когда есть такое большое количество больных, и, учитывая специфику заболевания, где достаточно длинный инкубационный период, что вероятность того, что все-таки какой-то инфицированный человек приедет в Россию – высока.

Однако было неочевидно, что, если инфицированный человек приедет в Россию, будет ли он распространять заболевание, ведь динамика заразности была еще не до конца известна.

В этом заключается вся сложность, связанная с пандемиями – чем отличаются пандемические заболевания от тех заболеваний, которые постоянно циркулируют, и почему для ученых, которые занимаются именно математическим моделированием – это все сложно спрогнозировать. Мы постоянно говорим, что нам нужны данные, и не даем четкие прогнозы, когда и что будет.

Когда мы говорим о заболеваниях, которые постоянно циркулируют среди населения – это эндемические заболевания, мы их изучаем достаточно давно, собираем большое количество данных на основании истории заболевания, и можем их хорошо параметризировать для математических моделей. То есть мы их уже изучили в какой-то степени, посмотрели, что происходило, изучив статистику прошлых лет, мы знаем различные показатели, вкладываем их в модели – в конечном итоге   за счет этого модель делает прогноз. После этого мы свои математические модели можем откалибровать и валидировать, то есть проверить на основании уже реальных исторических вспышек заболевания, которые уже происходили. Нам, как математикам, такая ситуация достаточно комфортна.

В этом смысле модели эндемических заболеваний – достаточно достоверные, и очень часто применяются учеными для формирования рекомендаций для лиц, принимающих решения, но, когда мы говорим о пандемии, речь идет о ситуации, в которой этого вирусного заболевания никогда не было среди населения, что вдвойне осложняет ситуацию с пандемическими новыми вирусами. Ведь, с одной стороны, никто не знает параметры этого заболевания, никто не понимает насколько оно заразно, насколько оно быстро распространяется.

Параллельно с тем, что возникает новое заболевание, которое люди еще не научились до конца диагностировать, врачи пока не понимают, что это за новый вирус, а, поскольку симптомы во многом схожи с ОРВИ и другими заболеваниями, происходит ситуация, когда все впервые случается для всех – параметров нет, данные еще не окончательно понятны, какое это заболевание – ОРВИ, пневмония или вирус COVID-19.

"Когда я говорю именно о сфере моделирования распространения инфекционных заболеваний, то такие модели без минимальной статистики не могут предсказать пандемию".

Когда появляется новое и необычное заболевание – математики не могут быстро сформировать долгосрочные прогнозы и сказать, насколько высока вероятность массового заражения. Хотя существуют некоторые модели, которые смотрят на то, как идут генетические мутации разных вирусов – есть целое направление науки, которое смотрит на вероятность формирования таких новых пандемических и циркулирующих вирусов, однако, это не моя сфера деятельности.

Имели ли Вы, на тот момент, расширенные и достаточно точные данные из Китая, чтобы достоверно смоделировать быстроту и степень распространенияCOVID-19 у нас? Ведь в России много регионов, которые связаны с Китаем в различных экономических сферах?

У нас есть официальная статистика данных, которая показывает насколько взаимосвязаны и какова мобильность людей между Китаем и Россией – это стандартная и классическая информация, которая у нас есть.

Данных, которых не хватало для создания детализированных моделей, у нас до сих пор нет. Эти данные важны для понимания различных параметров вируса. Я приведу несколько примеров.

Допустим, в рамках различных моделей, мы моделируем, что существует полностью не зараженное население, которое имеет иммунитет против этого вируса – это по определению, ведь мы говорим о новом вирусе. Очень часто обсуждается среди ученых, что есть некая гетерогенность внутри населения, которая говорит о том, что некоторые люди более склонны к заболеванию, другие – менее склонны.

Может быть, это некий иммунологический статус, может быть есть кросс-иммунитет к другим заболеваниям. Мы же знаем, что коронавирус – это не только COVID-19, но и другие штаммы. В этом контексте, может быть, существует такой кросс-иммунитет. Однако возникает вопрос – насколько разные люди и население обладают таким кросс-иммунитетом, и насколько он разнообразный – открытый вопрос до сих пор. И, конечно, требуется больше исследований для того, чтобы ответить на этот вопрос.

Еще один пример – мы знакомы с такими заболеваниями, как SARS, которые тоже находятся в категории коронавирусов. Существуют такие люди – super-spreader, которые заражают намного больше людей, мы видели в рамках SARS, что такие люди сильно влияют на скорость распространения болезни. Понятно, что и в ситуации с COVID-19, и в аналогичных случаях, мы не до конца понимаем природу super-spreader, а это очень важно для моделей.

У научного сообщества есть две версии, почему это происходит. Может быть, причина в том, что есть гиперактивные люди внутри населения – они очень часто со всеми общаются, потому заражают много людей. Есть вторая версия – может быть, они иммунологически более заразны. Когда эти люди уже заболевают и продолжают общаться с другими людьми – они просто выпускают больше вируса из своего организма.

Почему это происходит и как это моделировать? Разные гипотезы дают разные эффекты, разные результаты, с точки зрения динамики распространения болезни. Но, ответить на этот вопрос пока невозможно, потому что данных пока нет. Таких примеров, где точных данных пока нет – много.

Да, можно сказать, что математики ничего точно не могут сказать без наличия данных, но, на самом деле, это некое искусство, которым занимаются математики, создающие модели инфекционных заболеваний. Они должны найти правильный баланс между детализированной моделью – чем более она детализирована, тем больше данных им необходимо, и более абстрактной моделью, которая не имеет прогностической способности, то есть не может предсказать далекое будущее, но смотрит статистические данные и выстраивает небольшой прогноз, на небольшой период времени в будущем на основании исторических трендов.

Речь идет именно об упрощенных моделях, однако, их способность «думать в будущее» - ограничена, ведь эти модели не понимают все нюансы, которые, на самом деле, очень важны и влияют на динамику самой болезни.

Один из тех элементов, которым мы сейчас занимаемся – попытка найти правильный баланс, чтобы, с одной стороны, сказать что-то, но это будет ограничено, или же выстроить более детальную модель, которая позволит давать более серьезные и долгосрочные прогнозы и выводы.

Почему важны детализированные модели, о которых Вы говорите? Как их составлять и исследовать?

Давайте начнем с упрощенных моделей. Это классическая модель Кермак-Маккендрика – SIR модель, о которой сейчас очень много пишут, и все о ней знают.

"Конечно же, в реальной жизни это не так. У нас есть структура населения и, очевидно, что, если я заражусь, то, с большей степени вероятности, заразятся люди, с которыми я контактирую больше всего – моя семья".

Это стандартные дифференциальные уравнения, а не стохастическая модель, которая отвечает на серию вопросов вероятности. Она рассматривает все население, как полностью единообразное, гомогенное и, по сути, дает описание того, как будто бы все мы – газовые частицы, которые не имеют структуры взаимоотношения, а просто случайно сталкиваются и имеют какие-то случайные контакты.

Если не учитывать тот фактор, что я – единица в своей структуре населения, со своими конкретными контактами, то эта картина видится слишком пессимистично. Потому что, если бы я была газовым атомом, который летает и с кем угодно общается, то я могла бы заразить не только свои очень близкие контакты, а сразу же очень отдаленные контакты, и за счет этого – дальность распространения в таких газовых моделях может быть более быстрая.

Параллельно с этим есть еще направление, которое нужно рассмотреть. Речь идет о super-spreader, о которых я уже говорила. Из-за того, что они находятся, вероятно, в той части графа, то есть в нашей структуре населения, которые заражают очень быстро и очень многих людей. Поэтому такие элементы нужно до конца изучить и учесть все нюансы.

при

Пример SIR модели

Но давайте поговорим о той детализированной модели – это совершенно другая крайность.

Агентное моделирование относится к симуляционным моделям, в которых практически каждый человек моделируется. Другими словами – он агент, который имеет свои характеристики (примечание: когда я говорю «агент», важно подчеркнуть, что это просто типаж человека, который находится в моей возрастной группе, в моей демографической категории, с иными параметрами, которые описывают меня, как некий типаж человека).

Создается такой агент, у него есть иммунитет или его отсутствие, риск-группа, другие факторы. Такого рода агент в этой модели живет, ходит на работу или, когда происходит самоизоляция, он сидит дома, и имеет те контакты, которые существуют в его или ее семье. Когда самоизоляция заканчивается, этот человек идет на свое конкретное рабочее место (важно подчеркнуть нахождение в конкретных местах). Потом я отправляюсь в магазин, в который обычно чаще всего хожу, потому что это рядом с моей географией, мои дети учатся в определенной школе – так, все, что описывает нашу жизнь моделируется в агентной симуляционной модели.

В рамках такой модели, которая описывает наше поведение, мы видим, как распространяется заболевание, то есть можно заразить один типаж этого человека, исторически мы тоже понимаем, какие люди принесли это заболевание, и проследить, как идет динамика распространения болезни. Это уже совсем другой подход моделирования – большие сложные модели, которые рассчитываются. Нужно понимать, что такие симуляции необходимо делать много раз, потому что параметров очень много. Все их нужно откалибровать, понять, где стохастика и вероятность влияет на результат, который мы увидели с моделированием, а где просто вышла случайность.

Конечно, требуются сервера, большие вычислительные мощности и детализированные данные, которые входят в эту модель. Наверное, одно из самых популярных высказываний для специалистов которые занимаются моделированием это – «Garbage In – Garbage Out».

То есть, если данные, которые входят в модель – некачественные, то и результат этого моделирования тоже будет некачественным.

С одной стороны, такие модели очень важные, потому что описывают реально те факторы, которые важны для динамики распространения самого заболевания. Мы понимаем, что если мы их не учтем, то будем неправильно прогнозировать динамику болезни. С другой стороны, сложность заключается в том, что не всегда хватает таких детализированных данных для того, чтобы такие модели построить.

Насколько эффективно ограничение передвижения между различными городами? Как можно это математически смоделировать?

Эта одна из тех тем, которая мне очень интересна еще с того момента, когда я начала заниматься вопросами инфекционного моделирования. Наверное, самая типичная интуитивная реакция, для любого человека, который слышит, что где-то в Китае вирус распространяется – желание приостановить путешествия, закрыть границы. Интуиция подсказывает нам, что нужно «закрыться» в своей стране. Что мы понимаем?

"Мы понимаем, что 100% блокада передвижения между странами – это сложно реализуемая задача".

Высока вероятность того, что можно ограничить 90% передвижения, а это уже колоссальнейшее сокращение. Реально и на 95% сократить количество передвижений между странами. Однако, если идет распространение заболевания, идет прирост количества больных в стране, где эта болезнь существует, и показатели растут экспоненциально, а параллельно с этим мы допустим, что в 10 раз (но все же линейно) сократили количество людей, которые переезжают из страны-очага в страну, которая еще не имеет заболевания.

Если количество больных в стране, где началось распространение болезни – не сокращается, а продолжает экспоненциально расти, то ограничения по передвижению только задерживают, а не предотвращают момент распространения. Это говорит о том, что меры по сокращению передвижения между двумя странами, между различными городами – эффективны в том случае, когда они используются в комбинации с другими мерами. Сократить объем переездов в 10 раз – недостаточно. Какие еще факторы нужно учитывать для того, чтобы это сработало?

К тем 5-и или 10-и процентам людей, которые продолжают путешествовать, необходимо относиться с особой осторожностью – изолировать их до или после передвижения. Причем для распространения сильно заразного вируса, с большей степенью вероятности, достаточно одного человека, который приехал в новую страну. Гарантий нет – может быть, повезет, если он не сильно общителен или заразен, и никого не заразит, но, если он будет циркулировать внутри населения, сработает некая цепная реакция. Необходима гарантийная мера, что ни один инфицированный человек не попадет в население. А это уже изоляция… Мы знаем, что есть инкубационные периоды, длящиеся до трех недель, например, дней по 20. Вот и ответ – насколько нужно изолировать этих людей.

Второй фактор – необходимо наблюдать, когда сокращается динамика распространения в той стране, где есть заболевание. В этом случае, уже можно при определенных уровнях возобновить передвижение, потому что в стране нет экспоненциального роста и вероятность новых заражений – понижается.

Вы говорили о том, что нужно построить систему сбора данных в реальном времени. Что уже сделано на пути к этому?

Я бы сказала, что система построения сбора данных в реальном времени – это глобальная задача, а не простая вещь, которую можно реализовать за неделю, две недели или даже за три месяца.

Все это очень непросто, учитывая, что как классические статистические данные собираются не только в нашей стране, но и во всех странах мира. Есть классический календарь – регулярно эти данные собираются, анализируются и представляют какую-то официальную статистику. Однако мы все чаще и чаще, из-за инфекционных заболеваний или из-за иных сегодняшних вызовов видим, что для работы необходимо иметь более свежие и дезагрегированные данные. Это означает то, что классический подход сбора статистики, «не успевает» за тем, что нам необходимо для того, чтобы оперативно принимать различные решения. Следовательно, нужны новые источники данных, мы должны не только их собирать по-другому, анализировать быстрее, но еще и сделать доступными в реальном времени. Весь этот процесс – это построение глобальной системы. Этим сейчас много занимаются IT-компании, активно ведутся различные дискуссии. Например, у Google была такая система Google Flu Tracker. Из того, что люди «вбивали» в поисковик – было видно, что, скорее всего, наступил сезон гриппа. Люди все чаще и чаще «вбивали» - «болит горло», «у меня температура», «какие нужно пить лекарства». Из этих данных Google посмотрел и увидел, что это показатель того, что где-то идет нарастание заболевания.

С этими «неклассическими» источниками данных, нужно работать очень осторожно. Как правило, в них много шума, их нужно правильно очищать. Несмотря на это нужно все больше и больше внимания обращать на такие нетрадиционные источники данных, неклассическую статистику, и обогащать наше понимание того, что происходит, благодаря этим нестандартным данным. Конечно же, в этом случае возникает симбиоз между теми компаниями, в которых собираются эти данные. Например, мобильные операторы – это очень богатый источник информации. С другой стороны, тут необходимо найти способ, как правильно очищать данные от шума, который нас путает и вводит в заблуждение. Выстраивание такой системы – очень важная задача и ситуация с пандемией только подчеркивает эту важность, но применение системы – будет намного шире.

Расскажите пожалуйста, с учеными из каких сфер вы взаимодействовали больше всего по этому вопросу?

Мы создали рабочую группу при Российской академии наук. Члены этой группы – медицинское сообщество, экономисты, социологи. У нас даже со стороны традиционного физико-технического направления есть физики и математики, причем из различных сфер деятельности.

В моем понимании, чем более открытая идет дискуссия между всеми специалистами, тем лучше. Когда мы решаем такую многофакторную задачу, не должно быть взаимодействия только с медиками или, например, с математиками. Социологи, демографы – лучше понимают поведенческие характеристики людей. Ведь заболевание распространяют люди, и если мы знаем больше фактов про их поведение, то мы будем лучше понимать динамику распространения заболевания.

От медиков у нас есть информация, как вирус проникает в организм человека, как он заражает других людей. Параллельно с этим поступает полезная информация о загруженности системы здравоохранения, как работает эта система, какие процедуры 

"Ситуация внутри системы здравоохранения – это очень важный вопрос. Ведь на войне с пандемией врачи – наша первая линия защиты. Важно предусмотреть, чтобы в медицинских учреждениях не увеличивалось распространение заражения. Взаимодействие с экономистами – также эффективно и полезно. Понятно, что ограничения влияют на наш бизнес и экономику. Возникает вопрос – как долго мы можем сдерживать эту ситуацию?"

заложены внутри нее для того, чтобы сократить риск заражения.

Взаимодействуя с различными специалистами из научного сообщества, мы отвечаем на важные вопросы, также у нас появляется оптимизационная задача. Мы можем найти тех людей, которые с точки зрения, здравоохранения и заболевания COVID-19 – диспропорционально сложные. Допустим, население, которое находится в риск-группе. С другой стороны, можно определить, какие группы людей могут оставаться дома, при этом не влияя на экономический успех.

Самый яркий пример тех людей, кому важно оставаться дома – граждане пенсионного возраста. Один из открытых вопросов, который мы обсуждаем в рабочей группе – это важность детей в динамике распространения заболевания. Для таких заболеваний, как грипп, дети – очень активные  распространители заболевания. Многие отмечают и подчеркивают, что в ситуации с COVID-19 не так много детей заболели. Может быть, дети попадают в категорию бессимптомных распространителей этого заболевания? Если это так, то этот вопрос необходимо изучить и понимать, что дети не являются важным драйвером экономики, поэтому необходимо находить дополнительные меры, чтобы сократить вероятность их заражения не из-за того, что они заболеют, а из-за того, что они заразят тех людей, с которыми они проживают (примечание – садики и школы необходимы не только, как часть образовательной системы, но и как часть социально-экономической системы, которая позволяет родителям работать).

Такие оптимизационные задачи нам дают возможность определить, какие люди наиболее важны для экономики, для того, чтобы они могли возобновить свою деятельность поскорее, а, с другой стороны, они не являются ключевыми драйверами для распространения болезни. И их первых мы можем пустить обратно в работу.

COVID-19 – одна из тех задач, где однообразные меры для всех слоев населения – это слишком дорого. Но, если мы сможем найти таргетированные, оптимизированные решения, где кто-то возобновляет свою жизнь, а кто-то остается на изоляции, то это будет очень действенной рекомендацией нашей рабочей группы.

Литература по теме:

An Introduction to Infectious Disease Modeling (E. Vynnycky, R. White)

Flu: The Story of the Great Influenza Pandemic of 1918 and the Search for the Virus That Caused It (Gina Kolata)

Pandemics: A very short introduction (C.W. McMillen)

Engineering the System of Healthcare Delivery (W.B. Rouse, D.A. Cortese)

On Immunity (Eula Biss)

Polio: An American Story (D. Oshinsky)

Поделиться: