Что в "черном ящике"?

FXWizard · 12.10.2010

Что в "черном ящике"?

С завидной регулярностью в печати появляются сообщения о новых революционных методах, позволяющих успешно играть на финансовых рынках, не затрачивая при этом интеллектуальных усилий. Чаще всего эти методы оформляются в виде программ и предлагаются желающим за умеренную плату. О том, что стоит за такими предложениями, и говорится в данной статье.

Основные положения

Методом "черного ящика" мы назвали совокупность методов, охватываемых единым методологическим подходом. Чаще всего они используют в качестве инструментов статистические пакеты или нейросети, хотя нам известны случаи, когда применялись менее традиционные инструментальные средства.

Общее у этих методов сводится к следующему: "В настоящее время нереально дать полное описание механизмов функционирования финансового рынка, такое, например, какое дают законы Ньютона для механических систем. Поэтому будем считать, что нам ничего не известно об этих механизмах. Зато у нас есть ряды данных, описывающих функционирование рынка в прошлом. Важно, чтобы эти данные были "представительными, однородными и устойчивыми", а что именно они обозначают, нас не интересует. Эти данные, в сочетании с нашим замечательным инструментом, позволяют управлять портфелем гораздо лучше, чем любой другой метод, да еще и ни о чем не думать". Таким образом, финансовый рынок рассматривается как некий "черный ящик". У него есть входные параметры, которые можно померить, и есть выходы, которые тоже поддаются измерению. А как этот ящик устроен внутри, мы не знаем, и главное - не хотим знать. Насколько плодотворен такой подход? Поскольку во главу угла положены ряды данных, начнем именно с них.

Во-первых, данные должны быть достаточно полными. Для пояснения этого тезиса рассмотрим физический пример. Допустим, заряженная частица движется в электрическом и магнитном поле. Если и электрическое, и магнитное поля поддаются измерению, то найдется зависимость между этими полями и движением частицы. А что, если мы можем померить только электрическое поле, а магнитное измерению не поддается и меняется довольно сложно? Вероятнее всего, мы придем к выводу, что зависимость между электрическим полем и движением частицы отсутствует. Пример из физики выбран намеренно. Дело в том, что здесь хорошо изучена физическая суть явления, а поэтому можно с уверенностью сказать, какие факторы влияют на движение частицы.

В экономике все несколько сложнее. Сказать, какие факторы могут оказывать влияние на данный сегмент рынка, исходя из общих соображений, нельзя. Поэтому требуется достаточно содержательный экономический анализ задачи, то есть исследование того, что же находится в "черном ящике". На настоящий момент нет достаточных оснований полагать, что вся доступная информация дает полное описание того или иного сектора финансового рынка. Но допустим даже, что Бог или информационные агентства позаботились о том, чтобы информации было достаточно. Значит ли это, что можно ни о чем не думать? По-видимому, нет. Например, фондовый рынок описывается разными информационными агентствами с помощью индексов. Число этих индексов уже давно перевалило за десяток. Какой из них выбрать? Без экономического анализа на этот вопрос вряд ли можно ответить. Использовать все сразу - выход не лучший.

Во-первых, дорого. А во-вторых, мы увеличиваем размерность решаемой задачи и ухудшаем ее свойства, поскольку все эти индексы сильно коррелированы. Поэтому вполне вероятно, что найденное решение окажется слишком неточным и/или неустойчивым к погрешностям, которые неизбежны. Да и качество информации на сегодня оставляет желать лучшего. Чтобы убедиться в "представительности, однородности и устойчивости" информации, нужно определенное понимание процессов, происходящих в экономике.

Недостаток качественной информации можно заменить гипотезами о содержимом "черного ящика". Хотя именно здесь сторонники данного подхода проявляют принципиальность: "Мы занимаемся не абстрактной наукой. Мы имеем дело с деньгами и не хотим рисковать. Поэтому позволить себе пользоваться гипотезами мы не можем". Казалось бы, все солидно. Но посмотрим, что кроется за этими словами.

Почти очевидно: не принимая вовсе никаких гипотез, невозможно получить никакого содержательного вывода. И на самом деле приверженцы метода "черного ящика" неявно используют какие-то свои гипотезы. В каждом конкретном случае их нетрудно выделить. Но главный постулат сформулирован так: "Существуют законы, регулирующие функционирование рынка. Мы их не знаем, но предполагаем, что они остаются неизменными. Наша программа как раз и позволяет выявить эти законы и использовать их для принятия решений".

Алгоритмический подход

На первый взгляд все великолепно. На гипотезе существования неизменных законов базируется все научное естествознание. Уже несколько тысяч лет ученые только тем и занимаются, что выявляют такие неизменные законы, и никакого вреда от этого не было. А здесь всего-то и предлагается - заменить ученого программой, которая будет делать то же самое. Век кибернетики, как-никак. Вся беда состоит в том, что такой программы не может быть. Человек может заниматься поиском неизвестных закономерностей, а машина - нет. И понять это вовсе не сложно.

Допустим, существует программа, эдакий "универсальный прогнозист", которая работает следующим образом. На вход программы подаются некоторые ряды данных, а программа выдает их продолжение. Причем если существуют закономерности в изменении исходных рядов, и на вход подаются достаточно длинные отрезки, то программа правильно предсказывает продолжение.

Для простоты можно считать, что на вход подаются данные об одном показателе, принимающем всего два значения: 0 и 11. Нельзя исключать варианта, когда этот ряд данных порождается некоторым алгоритмом, то есть данные являются результатом работы некоторой другой программы. Здесь закономерность явно присутствует, и наш "универсальный прогнозист" должен в данном случае срабатывать.

Но эту программу можно написать, например, следующим образом. Возьмем текст "универсального программиста" и подправим в самом конце так, чтобы новая программа выдавала 0 всякий раз, когда "универсальный прогнозист" дает единицу, и 1 - в противном случае. Работая с таким рядом данных, наш "оракул" будет ошибаться на каждом шаге. То есть, предполагая существование "универсального прогнозиста", мы неизбежно придем к противоречию.
Из приведенных рассуждений видно, что программа может найти лишь те закономерности, которые "проще", чем она сама. А ведь основной пафос сторонников метода "черного ящика" как раз и заключается в том, что закономерности на финансовых рынках очень сложные. Каковой же тогда должна быть сложность программы?

Итак, любая программа может находить лишь закономерности из определенного, более или менее узкого класса. Если на самом деле существуют закономерности иной природы, то программа либо вовсе не найдет их, либо ее выводы будут ошибочны.

Пример с обезьяной

Приведем пример. Обезьяна, сидящая в клетке, открыла фундаментальный закон природы: если нажимаешь красную кнопку, то получаешь банан, а если нажимаешь зеленую, то получаешь удар током. Однако не исключено, что существует закономерность другого порядка, заданная планом эксперимента, предусматривающего переключение кнопок как раз тогда, когда обезьяна окончательно убедится в правильности своего закона. В один прекрасный день наша обезьяна получит вместо банана удар током, и это отнюдь не будет означать краха всей науки.

Поэтому, чтобы обоснованно применять прогнозирующие программы, нужно понимать, во-первых, какого вида закономерности позволяет обнаруживать программа, а во-вторых, какие закономерности действуют на рынке, - то есть опять-таки знать начинку "черного ящика".

Анализ данных показывает, что на достаточно длинных отрезках времени существуют простые зависимости между некоторыми параметрами рынка. Но в определенные моменты характер этих зависимостей может качественно меняться. Это отнюдь не означает, что функционирование рынка не подчиняется никаким законам. Просто эти законы сложнее, чем кажется на первый взгляд.

Но, допустим, некоторая закономерность найдена. Что же дальше? Классическая наука отвечает однозначно: дальше надо понять экономический смысл этой закономерности, то есть построить некоторую модель, осознать место найденной закономерности в ряду аналогичных. Без этого невозможно установить границы применимости найденных соотношений и в конечном итоге нельзя принимать обоснованные решения. Макс Борн писал по этому поводу: "Эксперимент вообще ничего не значит, пока он не интерпретирован теорией". А ведь он имел в виду физические явления, где возможности проведения эксперимента гораздо шире, чем в экономике, и эмпирические закономерности могут быть куда лучше обоснованы. Тем более нельзя придавать слишком большого значения эмпирическим закономерностям в экономике. Иначе мы рискуем оказаться в роли той самой обезьяны и получить чувствительный удар.

Точка зрения сторонников метода "черного ящика" прямо противоположна. На одном из семинаров были изложены следующие результаты. Исследовалась динамика показателей, характеризующих состояние экономики России в целом. Было рассмотрено десятка два таких показателей, причем оказалось, что фрактальная размерность множества, описывающего значения этих показателей, равна четырем. По сути, это означает, что имеется 16 нетривиальных и независимых соотношений между показателями. На вопрос об экономическом смысле данных соотношений последовал ответ, что даже саму постановку вопроса авторы не признают. Соотношения существуют, и все.

А ведь заранее не ясно, что они отражают: объективный экономический закон или конкретную методику расчета показателей в Госкомстате. В первом случае найденными зависимостями можно пользоваться без опасения, а во втором они верны лишь до тех пор, пока методика остается неизменной.

Статистический подход

Все сказанное относится и к тем вариантам метода "черного ящика", которые ориентированы на применение статистических пакетов. Однако эти варианты имеют и определенную специфику. Сама возможность применения вероятностных методов требует обоснования. Обычно говорят так: "Данная величина меняется непонятно как, поэтому мы со спокойной совестью можем считать ее случайной". И на этом строятся все дальнейшие рассуждения, использующие порой весьма тонкие математические методы. Но уже исходная посылка неверна. Следует четко различать поведение нерегулярной и случайной величин. Случайные величины обладают некоторыми весьма специфическими свойствами, и только к ним могут быть применены вероятностные методы. В частности, если мы будем вычислять средние значения реализаций случайной величины по большим регулярно устроенным множествам значений времени, то должен получаться один и тот же результат, независимо от выбранного множества. Например, чтобы цену какой-то бумаги можно было считать случайной величиной, необходимо, чтобы среднее значение цены во все вторники равнялось средней цене во все четверги. И если мы вычислим среднюю цену по всем дням, когда тринадцатое число попадает на пятницу, то снова должно получиться то же значение.

Величину можно считать случайной, если она прошла много таких тестов (теоретически - бесконечно много). Если же хоть один такой тест не сошелся - величина отнюдь не случайная. Нам не известно ни одного случая, чтобы аналитики, использующие вероятностные методы при моделировании финансового рынка, провели подобную проверку.

Вот что пишет по поводу теории вероятностей Бертран Рассел [1]: "Математическая вероятность возникает всегда из комбинации двух высказываний, одно из которых может быть полностью известным, а другое совершенно неизвестно. Если я вынимаю из колоды карту, то каков шанс, что это будет туз? Я полностью знаю строение колоды карт и знаю, что одна из каждых тринадцати карт есть туз; но я совершенно не знаю, какую карту я вытащу". С тем параметром, который совершенно неизвестен, обычно бывает все в порядке. А вот с другим - часто дело обстоит гораздо хуже. Но на это как-то не принято обращать внимание.

Обосновывая применение вероятностных методов, чаще всего кивают на их успешное использование в естествознании. Но там исходные гипотезы либо тщательно проверяются экспериментально (как в теории стрельбы), либо обосновываются теоретически (как в статистической физике). Почему-то в экономике ни то ни другое не считается обязательным. Для того чтобы применение вероятностных методов было обоснованным, требуется также, ч чтобы ряды данных были достаточно длинными. Многие авторы отмечают, что в рассматриваемом ими случае данных явно недостаточно... и все-таки пользуются вероятностными методами.

Не читайте "Краткий курс..."
Еще более очевидные ошибки совершаются, когда дело доходит до выбора закона распределения случайной величины. Приведем цитату [2]: "Помехи эти [в информационных потоках] являются результатом воздействия большого количества случайных факторов, и это обстоятельство облегчает работу с ними: хотя бы закон распределения известен - нормальный, в соответствии с центральной предельной теоремой теории вероятностей".

Но центральная предельная теорема говорит о законе распределения суммы большого числа одинаково распределенных и независимых случайных величин. Почему действие помех можно считать аддитивным - непонятно. Например, если помехи воздействуют на цену аддитивно, то их влияние на доходность уже не будет таковым. А какие есть основания считать помехи независимыми в экономике, где все взаимосвязано? И уж совсем непонятно, как можно говорить об одинаковом законе распределения, если мы даже не знаем, какие помехи действуют.

Таким образом, ни одна из посылок центральной предельной теоремы не является обоснованной, а вывод теоремы преподносится как непреложный закон теории вероятностей. Для тех, кто не знаком с центральной предельной теоремой, - сойдет. Посмотрим, как тот же автор предлагает проверять независимость случайных величин. "В простых случаях, когда необходимо установить степень связи между двумя временными рядами, вычисляется коэффициент парной корреляции, который может изменяться от -1 до 1. Чем теснее связь, тем ближе коэффициент к единице, и, наоборот, при отсутствии связи коэффициент стремится к 0".

Действительно, коэффициент корреляции независимых случайных величин равен нулю. Обратное неверно. Случайные величины с нулевым коэффициентом корреляции могут быть зависимы не только статистически, но даже функционально (например, одна из них может равняться квадрату другой). Это объясняется в любом добросовестном (не кратком) курсе математики (см., например, [3]). Но зачем их читать, когда есть "Краткий курс..."2.

Обо всем этом не стоило бы говорить, будь подобное явление единичным. К сожалению, дело обстоит как раз наоборот. При моделировании рынка ценных бумаг вероятностные методы применяются гораздо чаще, чем все прочие методы, вместе взятые. И случаи, когда это делается корректно, представляют собой редкие исключения.

Выводы

Сказанное отнюдь не означает, что я принципиально против применения теории вероятностей, нейросетей и т.д. Ничего хорошего нет в том, что старушку-процентщицу зарубили топором. Но из этого не следует, что топор - плохой инструмент. Просто использовать его надо по назначению.

Статистические методы незаменимы на этапе идентификации моделей, то есть когда вид всех зависимостей уже известен и остается определить численные значения некоторых коэффициентов. Применять же их в других случаях просто потому, что ничего другого не приходит в голову, не стоит. И еще одно следует напомнить. Разработка прикладных пакетов, ориентированных на исследование финансовых рынков, - это бизнес3. Не хуже любого другого бизнеса, но и не лучше. В частности, он не может существовать без рекламы. Разница между тем, что действительно готов делать пакет, и тем, как это описывается в рекламе, может быть значительной, а потому не надо покупать некачественные товары в яркой упаковке. Сам товар подчас бывает достаточно сложен, и чтобы разобраться в его реальном качестве, требуются значительные усилия. Но эти усилия оправданны. Если же вы не можете по какой-то причине оценить качество программы, то лучше совсем ею не пользоваться, даже если авторы ее очень хвалят.

Михаил Горелов www.forextimes.ru

Что в "черном ящике"?

FXWizard

Гуру форума