Введение
Метод анализа временных рядов "Гусеница", рассматриваемый в книге, помогает увидеть и выделить разного рода закономерности в поведении временных рядов, зачастую априори не очевидные. В книге приводится большое количество примеров. Наряду с примерами использования "Гусеницы" и подробным описанием методологии, авторы уделяют большое внимание также теоретическому исследованию метода.
Отметим, что под временным рядом мы понимаем набор {f(iD)}Ni=1 значений, вообще говоря, произвольной функции одной переменной f(t),t>0, в равноотстоящих точках iD (i=1,...,N). При этом переменная t не обязательно имеет смысл времени.
Во многих естественных науках сложилось представление о возможности описания природных процессов с помощью функций, состоящих из нескольких слагаемых f(t) = fT(t) + fn(t) + fr(t) + e(t), t Î [0,T], где fT(t) - медленная нерегулярная составляющая, обычно называемая трендом, часто ее пытаются описывать алгебраическими полиномами невысоких порядков; fn(t) - периодическая или сумма периодических составляющих; в зависимости от области приложений они называются сезонными, суточными и т.п. вариациями; fr(t) - быстрые нерегулярные малые вариации, в которые обычно включают все, что не укладывается в формальную модель, иногда сюда включают и случайные шумы; e(t) - чисто случайная составляющая, описываемая случайным процессом определенного типа.
Во многих частных случаях к настоящему времени созданы мощные теории с развитым аппаратом приложений и компьютерными реализациями в виде библиотек и пакетов программ. Так, для функций вида f(t) = fT(t) + e(t) такой теорией является теория аппроксимации (при малых e(t)) или метод наименьших квадратов математической статистики (при больших e(t)), для функций вида f(t) = fn(t) хорошо работает теория гармонических рядов Фурье.
Однако, во многих ситуациях возникают достаточно большие сложности эффективного исследования функций. Примером может быть случай f(t) = fT(t) + fn(t), где при отсутствии априорной информации о частотах компонент периодической составляющей не работают ни теория аппроксимации, ни теория рядов Фурье. В различных конкретных приложениях придумано много эвристических приемов, но они, как правило, плохо теоретически обоснованы. В настоящей книге делается попытка показать, что при использовании метода "Гусеница" часто оказывается возможным (приближенно) выделить отдельные составляющие исходного ряда.
В книге подробно описаны:
- методология (главы I,II,III)
- теоретическое обоснование (главы III,V)
- применения (главы I,IV,VII)
- программное обеспечение (глава VI)
Глава I является вводной. Она посвящена описанию базового алгоритма анализа одномерных временных рядов, реализующего метод "Гусеница", а также
его возможностей с демонстрацией примеров применения. В этой главе
формальное описание алгоритма сочетается с неформальным, включающим в себя
очень важное для методов такого рода рассмотрение визуальных представлений
результатов метода. Обсуждается выбор параметров, при этом учитывается
практический опыт применения метода авторами. Примеры подобраны так, чтобы,
с одной стороны, наглядно проиллюстрировать возможности "Гусеницы" и продемонстрировать
как можно больше способов разглядывания результатов, которые могут помочь
при использовании метода, а с другой стороны, обсудить возникающие при
применении метода проблемы.
В Главе II описаны основные идеи, приводящие к методам типа "Гусеница", а также сами эти методы. Материал главы в значительной степени
является обзорным, хотя, в силу обширности затрагиваемых тем, не претендует
на полноту. Разделы данной главы описывают стандартную процедуру анализа
главных компонент (АГК), использование АГК для анализа стационарных
временных рядов и в теории динамических систем, динамический анализ Фурье,
вейвлет-анализ, а также два метода, по сути совпадающие с некоторыми вариантами
"Гусеницы" - анализ сингулярного спектра (Broomhead и др.) и метод развертки
(Бухштабер), см. точные ссылки в конце главы II.
В Главе III базовый алгоритм, подробно описанный в
Главе I, распространен для решения задач обработки многомерных рядов и полей, а также прогнозирования одномерных и многомерных рядов. Развитие идеи метода "Гусеница", проведенное
в данной главе, показывает богатое и до конца не использованное содержание
этого метода. Изложение иллюстрируется большим количеством примеров.
В Главе IV описаны результаты подробного сравнительного анализа
метода "Гусеница" и классических методов анализа одномерных временных рядов
на трех стандартных наборах данных: объем пассажироперевозок на международных
авиалиниях, заболеваемость СПИДом в США и среднемесячное число яиц на несушку
в США. Результаты сравнительного анализа показывают, что на хороших данных
метод "Гусеница" по крайней мере так же хорош, как и испытанные классические
средства. В ряде же случаев он позволяет достичь того же результата более
естественным путем или обнаружить эффект, который не проявляют стандартные
методы.
Глава V посвящена теории метода "Гусеница". Ключевым разделом данной главы является первый, в котором метод исследован на языке
функционального анализа, точнее -- теории операторов Гильберта-Шмидта.
Показано, что на этом языке оказывается возможным не только описать единым
образом сам метод, его различные модификации и обобщения, но и объяснить
некоторые наблюдаемые на практике явления, возникающие при обработке реальных
временных рядов. В частности, исследованы асимптотические свойства метода,
существенно отличающиеся от его "допредельных" свойств.
В Главе VI описана реализующая базовый вариант метода "Гусеница" программа, которая находится на прилагаемой к книге дискете.
Глава VII содержит примеры, в которых метод "Гусеница" позволил получить содержательные с практической точки зрения результаты. Разделы
этой главы включают в себя интерпретацию результатов, данную специалистами
в соответствующих областях науки.
В заключении сделаем несколько замечаний, относящихся к отечественной
теории метода "Гусеница" (обзор зарубежных аналогов метода см. в Главе II).
Разработка метода явилась результатом стажировки по математической биологии
в МГУ в 1961 г. под руководством А.Н.Колмогорова выпускника математико-механического
факультета ЛГУ О.М.Калинина. В это время А.Н.Колмогоров проявил активный
интерес к задаче выделения периодичностей в природных процессах. Отметим,
в частности, работу 1962 г. Арато, Колмогорова и Синая, посвященную Эйлеровскому
(10 месяцев) и Чандлеровскому (14 месяцев) периодам в движении полюсов
Земли. Метод был сфрмулирован О.М.Калининым в 1969 г. и впервые изложен
в дипломной работе М.Д.Белонина, а затем опубликован в 1971 г. в обзоре
"Факторный анализ в нефтяной геологии", М., "Недра". В дальнейшем этот
метод подвергался анализу и развитию в самых различных направлениях. Первым
опубликованным практическим променением метода можно считать диссертацию
М.М.Кислицина, выполненную под руководством О.М.Калинина и В.М.Ахутина
в 1977 г. (см. также статью М.М.Кислицина в настоящем сборнике).
Метод многократно реализовывался на разных типах ЭВМ (начиная с M-20,
необходимо отметить значительную роль Т.П.Кистер, которая во многом способствовала
пониманию особенностей программной реализации метода), однако не нашел
широкого применения до появления ЭВМ серии СМ, допускающих диалог с пользователем.
Особенностью метода (как это видно из других статей этого сборника) является
существенное использование диалога и визуализации результатов вычислений.
Первой интерактивной реализацией метода была программа на СМ-4, реализованная
в 1989 г. О.В.Богдановой и В.Н.Солнцевым. В этой же программе впервые "Гусеница"
была дополнена весьма существенным блоком восстановления. В 1991–1992 гг.
она была перенесена на ПК студентами математико-механического факультета
В.Б.Мартыновой и Л.Ю.Котовой под руководством Н.Ю.Баланиной. Появление этой
программы послужило толчком к началу целого ряда теоретических, программистских
и прикладных исследований, промежуточный итог которых представлен в настоящем
сборнике. Отметим также статью В.М.Бухштабера, 1994 г., идеи которой оказали
серьезное влияние на ряд ниже публикуемых исследований.
Авторы будут благодарны всем читателям, которые пришлют нам свои впечатления,
замечания и пожелания по адресу gusgistatgroup.com
|