Как мы внедряли машинное обучение в трейдинг – опыт Richardson GMP

Канадская инвестиционная компания опубликовала исследование о том, как методы машинного обучения позволили ей существенно улучшить показатели торговых стратегий. 

Финансовые рынки становятся все более сложными и эффективными, что затрудняет работу на них с использованием традиционных методов анализа. И хотя мы еще находится на заре развития новейших технологий, некоторые специалисты уже используют множество доступных данных для применения сложных количественных технологий, таких как машинное обучение (machine learning, ML). 

Эти технологии не решат все проблемы, но помогут финансовым управляющим получать близкую к безрисковой доходность в условиях высокой конкуренции.

Большие данные (Big Data) и будущее финансов

Сегодня объемы данных растут в геометрической прогрессии. По оценкам IBM, за последние два года было создано 90% всех мировых данных, которые появляются из трех основных источников: частных лиц, компаний и сенсорных датчиков. 

Люди увеличивают потоки информации при каждом посте в Instagram или поездке в Uber, компании генерируют сегодня больше транзакций, чем когда-либо, а датчики уже фиксируют данные почти со всех окружающих нас предметов – от стиральных машин до ветровых турбин. По данным Seagate, в 2017 году объем сгенерированных данных оценивается примерно в 21 ЗеттаБайт (ЗБ, единица измерения информации, 1 ЗБ = 1021 байт), а к 2025 году он может превысит 160 ЗБ.

Финансовый мир также полон информации: финансовые рынки, экономические показатели и новости обеспечивают ее практически безграничную генерацию. Большинство инвесторов имеют доступ к одним и тем же данным в одно и то же время, что затрудняет успешную игру на рынке при использовании традиционных методов. Поэтому многие управляющие, желая получить преимущество, начинают осваивать альтернативные источники данных.

…Тем не менее в секторе финансов все еще наблюдается относительная отсталость или консервативность по сравнению с другими отраслями. Основная причина тому заключается в дефиците специалистов, которые одинаково хороши как в финансах, так и программировании. При этом активно растет число приложений, использующих машинное обучение, появляются различные виды алгоритмов, которые можно использовать для реализации инвестиционных стратегий. 

Применение машинного обучения в трейдинге

Конечно, мы в Richardson GMP не являемся настоящими специалистами по Big Data, но признаем возможности, которые она раскрывает. Поэтому мы нанимаем квантов и внедряем различные технологии в управление инвестиционным портфелем, чтобы оптимизировать все процессы и получать прибыль. Мы считаем, что симбиоз человека и машины в работе гораздо эффективнее, чем их работа по отдельности. И мы твердо убеждены, что поведенческий фактор, предубеждения и субъективность, вызванная эмоциями, заставляет инвесторов действовать иррационально. Это приводит к покупке неправильно оцененных активов. При этом человек, совершив ошибку один раз, может вновь наступить на те же грабли, что в результате приведет к росту числа неправильных решений. 
Используя в своей работе количественные беспристрастные «машинные» стратегии в сочетании с человеческим аспектом – нашим поведенческим опытом в области финансов и традиционного управления портфелем, – мы пытаемся выявить неправильно оцененные активы, чтобы на них заработать. 

Пример разработки стратегии с применением машинного обучения

Мы решили улучшить базовый поход к нашей стратегии, и первым шагом стало изменение инструментов для скрининга – анализа и сбора данных. Excel был слишком медленным для наших задач, поэтому мы заключили партнерство с квантовой командой Bloomberg, чтобы разработать систему, которая выполняла большую часть работы в облаке. Результатом стал динамический инструмент на основе Python (высокоуровневый язык программирования), который отображает различные индексы для трейдинга. Мы использовали этот инструмент, чтобы составить общую базу данных на 20-летнем промежутке. 

Следующим шагом стала автоматизация нашей торговли, установление идеальных уровней для стоп-лосса и трейлинг-стопа (автоматическое перемещение цены ордера стоп-лосс следом за ценой актива с небольшим отставанием на заданную разницу – Прим. ред). Эта оптимизация значительно улучшила результаты нашей стратегии, которая превзошла доходность инвестиций в индекс S&P 1500. 

Наконец, третий шаг – применение машинного обучения. Мы решили, что будем использовать в работе «контролируемое машинное обучение», когда мы посылали машине вопросы (Х) и ответы на них (Y). Впоследствии система стала учиться сама, используя данные, полученные в ходе идентификации поставляемых нами шаблонов. 

В Richardson GMP мы пробовали использовать различные модели, но остановились на нелинейном методе опорных векторов (Support Vector Machines, SVM), так как именно он постоянно показывал хорошие результаты. SVM – это набор контролируемых алгоритмов обучения, которые хорошо работают в многоразмерных пространствах. 

Эти алгоритмы используют разделяющую плоскость (decision boundary) в случае пространств большой размерности и делит данные на несколько классов. Наша цель заключалась в том, чтобы на уровне предиктивной аналитики алгоритмы смогли разделить наши торговые решения на классы Yes и No. Первый класс означает сделки, приносящие гарантированную высокую прибыль, вторые – сделки, которые не являются такими. 

В результате три из четырех «новых» стратегий, использовавшие машинное обучение, смогли обогнать нашу базовую стратегию по отношению к бенчмарку (S&P 1500). К слову, для составления нашей базовой стратегии мы использовали все накопленные данные (фундаментальные, исторические, рыночные и т.д.) за 10 лет. 

Затем на промежутке с апреля 2010 года по апрель 2018-го мы стали использовать различные варианты алгоритмов, чтобы выяснить, какую выгоду дает «чистое» использование элементов машинного обучения и предиктивной аналитики по сравнению с результатами базовой стратегии, где эти алгоритмы не использовались. 

Рост доступности и использования данных уже оказывает влияние на финансы. Пока еще это находится на ранней стадии развития. Однако некоторые специалисты (включая нас) уже используют множество доступных данных для применения сложных методов. Машинное обучение никогда не решит все проблемы рынка, однако может помочь найти преимущества в высококонкурентной среде. Мы оптимистичны в том, что изучение данных поможет повысить ценность наших инвестиций. 

Сочетание традиционного управления инвестпортфелями, поведенческой экономики и машинного обучения дадут нам эти преимущества. 

Материал подготовлен при поддержке компании «Алго Капитал». Статья основана на отчетах управления по работе с частным капиталом компании Richardson GMP. С полным отчетом «Big Data & Machine Learning» можно ознакомиться по ссылке

Ссылка на источник

Все новости
Предыдущая новость Следующая новость
Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, пользовательских данных (сведения о местоположении; тип и версия ОС; тип и версия Браузера; тип устройства и разрешение его экрана; источник откуда пришел на сайт пользователь; с какого сайта или по какой рекламе; язык ОС и Браузера; какие страницы открывает и на какие кнопки нажимает пользователь; ip-адрес) в целях функционирования сайта, проведения ретаргетинга и проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.