Недавно Кабмин с большой помпой обнародовал данные о численности населения Украины, с разбивкой по регионам, с детализацией по возрасту и полу и тд. Одним из аргументов в пользу такой «оценки», а не традиционного переписи по стандартам ООН, было удешевление и использование современных технологий, сочетание данных различных реестров и тд.
23 января министр Кабинета министров Украины Дмитрий Дубилет в своем телеграмм-канале опубликовал PDF-файл с презентацией «Оценки численности наличного населения». Больше данных, как и более детального объяснения применяемых методов оценки, опубликовано не было.
Одним из методов был заявлено «Комбинированный метод оценки численности наличного населения (данные половозрастной структуры населения + данные реестров)».
Что известно об этом методе?
Украинский центр общественных данных решил посмотреть, насколько половозрастная структура населения, представленная в «Оценке ...», коррелирует с данными, опубликованные на сайте Государственной службы статистики Украины.
Получив данные, лежащие в свободном доступе на сайте Госстата, эксперты сгруппировали их по возрастным группам, указанным в презентации Дубилета:
Дети: 0-14 лет
Ранний трудоспособный возраст: 15-24 года
Основной трудоспособный возраст: 25-54 лет
Зрелый трудоспособный возраст: 55-64 лет
Пожилые люди 65 лет и старше
Результат можно увидеть в таблице.
Затем обобщенные по возрастным группам данные сопоставили с показателями из презентации Дубилета. Сразу как-то странно поразило практическое одинаковое соотношение между половозрастными группам - оно составляет около 88,8% (данные Дубилет от данных Госкомстата).
Неужели никакой «экстраполяции» на самом деле не было? А было тупое умножение данных Госкомстата на коэффициент 0,888? А незначительные различия - это лишь результат округления (ибо не комильфо указывать в заключении, что у нас подсчитано 8 110 378,392 человек).
Чтобы проверить это предположение эксперты попробовали воссоздать возможное применение коэффициента 0,888 к данным Госкомстата. После нескольких итераций (что заняло около получаса времени), удалось с практически 100% точностью сгенерировать данные, которые опубликовал Дубилет, подав это как результат «экстраполяции» данных пенсионного реестра на данные Госкомстата.
Эти расчеты может повторить каждый желающий - табличка с расчетами выложена в свободный доступ.
Как видно из табличек, только для одной половозрастной группы (женщины, 15-24 года) результат примитивных расчетов не совпал с супер-современными методами обработки и анализа «big data» господина Дубилета. Так, вместо 1740 тысяч человек, у экспертов получилась 1741 тысяча человек.
Но, при этом, стоит отметить, что у Дубилета также не сходятся суммы по возрастным группам. Так, если просуммировать всех мужчин в его презентации, то получается 17 млн 281 тыс, а не 17 млн 280 тыс человек.
Итак, итоги:
Во-первых, господин Дубилет и его команда сфальсифицировали общенациональное исследование, сознательно введя в заблуждение всю Украину.
Во-вторых, сделали они это тупо и неуклюже.
Статистика располагает разными методами, но почему "отодвинули" Госстат? Кто принял такое решение? Теперь у нас будет два Госстата?