+

Как спрогнозировать доходность ICO с помощью машинного обучения

17.05.2018

Вы слышали о Биткоине? Это одна из криптовалют, которым Википедия дает следующее определение:

«Криптовалюта – это цифровой актив, предназначенный для использования в качестве расчетного средства. Для обеспечения безопасности транзакций, контроля за созданием дополнительных единиц и подтверждения переводов в этой технологии используется криптография».

А знаете ли вы, что на самом деле криптовалют гораздо больше? Фактически, новые коины появляются ежедневно. Процесс их создания называется первичным размещением коинов, или ICO. На данном этапе, используемом компаниями и организациями для привлечения финансирования, участники приобретают новые коины. Обычно во время ICO токены продаются по более низким ценам, так как на этом этапе за ними стоит только идея или прототип, да и о проекте в целом мало кто знает. Впрочем, когда эти коины попадают на биржи или когда компания выпускает продукт, стоимость токенов может вырасти в несколько раз. Например, первые инвесторы приобретали Эфириум примерно за 30 центов, а к февралю 2018 года цена на него выросла до 936 долларов, Иными словами, на тот момент доходность ETH достигала 300.000%. Если бы на этапе ICO вы вложили в Эфириум 100 долларов, то к февралю 2018 года у вас было бы около 300.000 долларов.

Стоимость Эфириума (по состоянию на 16 февраля 2018 года) взята с сайта https://coinmarketcap.com/currencies/ethereum/

Если вы взглянете на сумасшедшие показатели доходности, то поймете, почему многие стремятся вкладывать средства в подобные инициативы. Впрочем, эта задача далеко не так проста, как может показаться: при имеющемся разнообразии проводимых ICO правильно выбрать проект для вложения средств довольно сложно. Нередко кампании по первичному размещению токенов оказываются мошенническими, и тогда инвесторы теряют все свои деньги.

Пять самых прибыльных ICO (источник https://icostats.com/roi-since-ico, по состоянию на 16 фев. 2018 г.)

Существует множество платформ, где собрана актуальная информация о предстоящих ICO. В их число входит, например, портал icodrops. Кроме того, отслеживанием и оценкой ICO занимаются также и многие участники криптосообщества. Мой фаворит среди лидеров мнений – Иэн Балина. При выборе проектов для инвестирования он основывается на доступных данных о них и ведет таблицу, в которой каждое ICO описано с позиций цифр, баллов и оценок. Конечное решение о вложении средств принимается исходя из полученных результатов.

Таблица Иэна

Я же предлагаю вам пойти несколько дальше и воспользоваться моделью машинного обучения, которая предсказывает доходность на основе данных Иэна.

Для начала я взял сведения из его таблицы и создал первый комплект данных. Для каждого ICO я добавил минимальную, максимальную и входную цену с сайта coinmarketcap.com (входная цена – это первая цифра в их таблице). Я также скорректировал некоторые показатели, воспользовавшись информацией с сайтов icodrops.com и tokendata.io.

Как видите, в некоторых строчках показатели стоимости с сайта coinmarketcap.com отсутствуют, так как речь идет о новых проектах, которые пока не представлены на биржах. Давайте попробуем спрогнозировать их максимальную доходность!

Строки, содержащие полную информацию с сайта CMC, будут использоваться как данные для тренировки. В нашей модели мы используем следующие входные столбцы:

• Ian_ICO_Grade — цифры, полученные Иэном Балиной;
• Largest_Bonus — информация о размерах бонусов;
• ICO Price – стоимость на этапе ICO;
• Number of ICO tokens – количество токенов, доступных для покупки на этапе ICO;
• Total Supply Ratio – общий коэффициент предложения, полученный путем деления количества токенов на этапе ICO на их общее число;
• ICO Market Cap – объем рыночной капитализации ICO;
• Prototype – информация о доступных прототипах;
• Team – сумма баллов, присвоенная Иэном командам каждого из проектов;
• Advisors – сумма баллов, присвоенная их консультантам;
• Idea – сумма баллов за идею, положенную в основу проекта;
• Community – масштаб сообщества проекта;
• Security — информация о том, относится ли данный токен к типу токенов-акций;
• Type — тип продукта;
• Audience — публика, на которую он ориентирован.

Результатом наших вычислений станет показатель Max_CMC_x, полученный следующим путем:

Max_CMC_x = Max_CMC / ICO_Price

(Примечание: на этапе тренировки я использовал логарифм числа Max_CMC_x из соображений более оптимального распределения).

Для тренировки модели машинного обучения я воспользовался сервисом mljar.com, задействовав пятикратную перекрестную проверку, метрическую оценку среднеквадратичной ошибки, пакеты XGBoost и lightGBM и алгоритм «случайный лес».

Настройка тренировки модели машинного обучения на сайте mljar.com

MLJAR осуществляет поиск среди множества разнообразных алгоритмов машинного обучения и выбирает наиболее подходящий для тренировки набор данных. Да, моделей тут предостаточно, и с их помощью можно сделать массу интересных вещей!

Модели с сайта MLJAR

Какие функции важны для прогнозирования доходности ICO?

Важность различных показателей в оптимальной модели, имеющей самый низкий показатель среднеквадратичной ошибки. Чем длиннее полоса, тем важнее показатель.

Интересно!

• Стоимость на этапе ICO оказалась самым важным показателем для расчета потенциальной доходности! Объяснить это довольно легко: чем ниже цена, тем больше потенциал будущего роста.

• Второй по степени значимости стала оценка, присвоенная Иэном Балиной, которая коррелирует с качеством продукта. Чем она выше, тем лучше проект, и тем выше вероятность роста цены.

• Кроме того, среди шести важнейших показателей были перечислены количество токенов и объем рыночной капитализации ICO, а также общий коэффициент предложения. На мой взгляд, как и в случае стоимости на этапе ICO, с их помощью инвесторы пытаются оценить потенциал будущего роста.

• Масштаб сообщества тоже очень важен: чем больше людей интересуется проектом, тем лучше.

Какую доходность модель спрогнозировала для уже прошедших ICO?

Давайте возьмем метапризнаки out-of-fold (OOF) и проверим, какую доходность модель предскажет для прошедших ICO. Будет интересно сравнить их с реальными показателями. Итак, первая двадцатка самых прибыльных проектов по версии нашей модели выглядит следующим образом:

Согласно полученным данным, самыми прибыльными должны были стать проекты District0x, 0x и Red Pulse. Любопытные результаты показали токены, у которых показатель OOF_Prediction оказался намного выше Max_CMC_x (Max_CMC_x = Max_CMC/ICO_Price). Например, для Icon с доходностью 115x модель предсказала «только» 18x.

Я расцениваю эти результаты так: коины, у которых значение OOF_Prediction оказалось намного выше значения Max_CMC_x, имеют потенциал роста: например, AirToken может вырасти еще в 5 раз. С другой стороны, токены, у которых значение OOF_Prediction намного ниже значения Max_CMC_x, могут быть неоправданно дорогими. Или же это ошибка модели.

Все прогнозы, рассчитанные ею для прошлых ICO, можно найти здесь.

Какую доходность модель прогнозирует для новых ICO?

Давайте рассчитаем доходность тех проектов, где она еще неизвестна. Ниже приведен список 20 токенов, показавших лучшие с этой точки зрения результаты:

Доходность, предсказанная с помощью модели машинного обучения

Как видите, самым прибыльным оказался токен из таблицы Иэна с кодовым названием Zombie.

С другой стороны, позиции токенов Telegram не выглядят слишком многообещающими: модель предсказывает им «скромную» доходность на уровне 6,8x. По моему мнению, это вызвано гигантскими объемами рыночной капитализации на этапе ICO, и именно поэтому модель выдала столь сдержанные прогнозы касаемо доходности проекта.

Все прогнозы для грядущих ICO, полученные с помощью нашей модели, можно найти здесь.

Выводы

Инвестиции в ICO могут быть очень прибыльными. Правильный выбор коина для вложения средств требует тщательного анализа. Самым разумным я считаю подход, основанный на данных. Дополнив таблицу сведениями, полученными с помощью модели машинного обучения, мы обеспечим инвесторам возможность оценить потенциальные доходность и выходную цену. Организаторам ICO, в свою очередь, технологии машинного обучения могут быть полезны с точки зрения создания привлекательной для инвесторов экономики.

Данные, использованные в этой статье, доступны здесь.

Код, использованный для предварительной обработки данных, можно найти по этой ссылке.

Дисклеймер: автор не несет ответственности за потери, которые могут быть понесены в результате полного или частичного применения материалов данной статьи на практике. Они не должны расцениваться как финансовые или инвестиционные рекомендации.