Издательство СО РАН

Издательство СО РАН

Адрес Издательства СО РАН: Россия, 630090, а/я 187
Новосибирск, Морской пр., 2

soran2.gif

Baner_Nauka_Sibiri.jpg


Яндекс.Метрика

Array
(
    [SESS_AUTH] => Array
        (
            [POLICY] => Array
                (
                    [SESSION_TIMEOUT] => 24
                    [SESSION_IP_MASK] => 0.0.0.0
                    [MAX_STORE_NUM] => 10
                    [STORE_IP_MASK] => 0.0.0.0
                    [STORE_TIMEOUT] => 525600
                    [CHECKWORD_TIMEOUT] => 525600
                    [PASSWORD_LENGTH] => 6
                    [PASSWORD_UPPERCASE] => N
                    [PASSWORD_LOWERCASE] => N
                    [PASSWORD_DIGITS] => N
                    [PASSWORD_PUNCTUATION] => N
                    [LOGIN_ATTEMPTS] => 0
                    [PASSWORD_REQUIREMENTS] => Пароль должен быть не менее 6 символов длиной.
                )

        )

    [SESS_IP] => 3.135.195.249
    [SESS_TIME] => 1713916769
    [BX_SESSION_SIGN] => 9b3eeb12a31176bf2731c6c072271eb6
    [fixed_session_id] => 2b92ce7a0956892d5e948d67eeeed499
    [UNIQUE_KEY] => dc1ab1ebeaad0a82bbdd2b653f886bba
    [BX_LOGIN_NEED_CAPTCHA_LOGIN] => Array
        (
            [LOGIN] => 
            [POLICY_ATTEMPTS] => 0
        )

)

Поиск по журналу

Вестник НГУЭУ

2020 год, номер 3

ИМПУТАЦИЯ ДАННЫХ МУНИЦИПАЛЬНОЙ СТАТИСТИКИ

Т.Б. Скрипкина
Новосибирский государственный университет экономики и управления «НИНХ», Новосибирск, Российская Федерация
t.b.skripkina@nsuem.ru
Ключевые слова: импутация статистических данных, восстановление пропусков данных, муниципальная статистика, метод K ближайших соседей, критерий согласия Пирсона, imputation of statistical data, restoration of data omissions, municipal statistics, K nearest neighbor method, Pearson's consent criterion
Страницы: 277-286

Аннотация

Рассмотрена ключевая проблема проведения статистического анализа на массиве данных муниципальной статистики: наличие существенного количества пропущенных данных. Приведено понятие и виды импутации данных. Обосновано применение метода K ближайших соседей для проведения импутации на этапе использования данных официальной статистики, содержащихся в Базе данных показателей муниципальных образований. Предложен авторский алгоритм восстановления пропусков в массиве данных показателей муниципальной статистики с использованием системы STATISTICA . Верификация результатов импутации проведена путем сравнения распределений исходных и восстановленных данных на основе критерия согласия Пирсона .