machinelearningmastery.ru

Машинное обучение, нейронные сети, искусственный интеллект
Header decor

Home

Исследование пульсирующих переменных звезд с регрессией гауссовского процесса

Дата публикации Mar 30, 2018

Гауссовские процессы оказываются полезными для моделирования явлений, которые нелегко описать классической одно- или многовариантной регрессией. Однако во многих случаях их предсказательная сила снижается при работе со значениями характеристик, которые находятся за пределами области данных обучения. Исключением, однако, являются ковариационные функции гауссовского процесса, основанные на тригонометрических функциях, таких как sin (Икс). Эти функции, характеризующиеся периодическим характером их оценок, могут использоваться для моделирования устойчивых циклических явлений, выходящих за пределы периода времени, охватываемого данными наблюдений.

Ниже я покажу иллюстрацию с использованием регрессии гауссовского процесса с ковариационной функцией ExpSineSquared для моделирования кривой яркости типа пульсирующей переменной звезды. Попутно я поделюсь ключевыми подводными камнями и идеями, с которыми я столкнулся, и надеюсь, что вы найдете относительно интуитивное объяснение этого упражнения.

Пульсирующие переменные звезды

Яркость звезды может пульсировать по одной из множества разных причин. Для некоторых характер пульсации хаотичен и, по-видимому, случайен, как в случае новых звезд (взрыва звезды) или звезд с повторяющимися пятнами. Для других, таких как звезда, которую я буду использовать в этом анализе, модель является последовательной и стабильной.

Длиннопериодные переменные - это красные гигантские звезды, которые пульсируют из-за изменения размера звезды. Звезда, на которой я остановлюсь, Омикрон Кити в созвездии Кита (также известное как «Мира»), является наиболее известным и изученным примером переменной длительного периода. Изменения светимости Миры происходят из-за изменений температуры звезды, вызывающих колебания в размерах, а также в длине волны света, выходящего в зрительный диапазон и выходящего из него.

Я буду использовать наблюдения за светимостью Мира с 1985 по 2007 год, чтобы предсказать кривую светимости с 2008 года. Данные, которые я буду использовать, находятся в свободном доступе из Международной базы данных AAVSO, которая собирает вклады звездных наблюдателей по всему миру.

Подгонка Гауссовой регрессии процесса

Для облегчения этого анализа я использовал регрессию Гаусса (GPR) в Scikit Learn. Первоначальная проблема заключалась в уменьшении размера данных до приемлемого размера. Время выполнения GPR масштабируется с (размером выборки) ³, поэтому по мере увеличения объема данных время выполнения GPR быстро становится непрактичным. Для моего анализа я обнаружил, что взятие случайной выборки из 1000 наблюдений из обучающих данных (которая насчитывала более 80 000 наблюдений) давало относительно стабильные результаты, сохраняя время выполнения менее минуты или около того.

Я начал с ядра ExpSineSquared, объединенного с ядром WhiteNoise, чтобы уловить случайную волатильность, присущую измерению яркости Миры. Тщательный выбор предшествующих гиперпараметров ядра, а также установка верхних и нижних пределов гиперпараметров имели решающее значение для установления хорошего соответствия. Я повторял этот процесс бесчисленное количество раз, каждый раз приводя к плохой подгонке, пока не отточил два разных параметра:

  • WhiteNoise верхняя граница: перед установкой верхней границы уровня шума модель неоднократно подбирала «ленивое» заднее ядро ​​с высоким значением шума. Как только я качественно оценил степень «истинного» шума в любой заданной точке кривой обучающих данных, я установил верхнюю границу 0,5, исходя из того, что количество шума никогда не должно превышать это значение.
  • ExpSineSquared периодичностьПо аналогии с параметрами WhiteNoise, после того, как я установил верхнюю и нижнюю границы для гиперпараметра периодичности, я увидел значительное улучшение подбора георадара. Установить границы здесь было так же просто, как посмотреть на график рассеяния данных кривой блеска и оценить расстояние между пиками и долиной.

Вот итоговое совпадение после применения обоих этих ограничений гиперпараметров:

На этом графике я расширил прогнозируемые результаты в наблюдениях 2008–2018 гг. Эта перекрестная проверка соответствия одноядерного георадара с данными за пределами учебного окна является моей основной проверкой точности прогнозирования. На следующем графике показаны остатки фактической наблюдаемой яркости за 2008–2018 гг. По сравнению с подобранными оценками за тот же период.

Другой вопрос, на который я хотел ответить, заключался в следующем: предлагает ли многоядерный GPR более подходящее соответствие кривой яркости Mira, чем одно ядро ​​ExpSineSquared (+ WhiteNoise)? Ответ да, и нет. Для установки георадараисключительно к тренировочным даннымобъединение ядра ExpSineSquared с любым количеством других стационарных ядер обеспечивает улучшенную подгонку. Однако, помимо обучающих данных, предельный выигрыш от добавления второго стационарного непериодического ядра быстро становится минимальным. Посмотрите, ниже, подходящий GPR с использованием ядра ExpSineSquared, умноженного на RBF. Когда расстояние от обучающих данных увеличивается выше лямбда-параметра RBF, RBF падает до нуля и GPR становится бесполезным

Однако это не означает, что одноядерный GPR всегда превосходит многоядерный GPR. Если моделируемые явления проявляют периодичность в течение более чем одного промежутка времени, может быть целесообразно использовать несколько ядер ExpSineSquared. В этом случае каждое ядро ExpSineSquared может быть приспособлено к различным гиперпараметрам периодичности для достижения превосходной точности прогнозирования.

Вот те же данные, связанные с ковариационной функцией, которая суммирует два ядра ExpSineSquared (+ WhiteNoise).

Несмотря на то, что георадар соответствует одному из ядер ExpSineSquared с параметром периодичности ~ 1500 дней, прогностическая сила этой модели (как показано на следующем остаточном графике и сравнение среднеквадратичных ошибок между GPR с 1 и 2 ядрами) отсутствует. существенно не улучшилось.

dasotelo / Python_Projects / Omicron_Ceti.py

Внесите свой вклад в разработку Python_Projects, создав учетную запись на GitHub.

github.com

Оригинальная статья

Footer decor

© machinelearningmastery.ru | Ссылки на оригиналы и авторов сохранены. | map