indicator (indicator) wrote,
indicator
indicator

«Одна зарплата среднего игрока раз в 10 больше, чем стоит работа всей системы»

Как российско-канадский стартап предсказывает результаты хоккейных матчей


Jeanine Leech/Icon Sportswire/Global Look Press

Сможет ли компьютерная аналитика предсказывать результаты точнее опытных букмекеров, исчезнут ли профессии тренера и скаута, насколько велика роль везения и куража, а также стоит ли стартапам тратить время на поиск инвесторов и где искать лучших в мире разработчиков, Indicator.Ru рассказал генеральный директор компании ICEBERG Analytics, занимающейся созданием систем аналитики для хоккея, Александр Мартынов.

— Как работает ваша аналитика? Какие данные вы собираете и что получается в результате?

— Наша система состоит из трех камер, установленных под потолком хоккейной площадки, мы записываем видео и склеиваем его, получая панорамную картинку льда. Имея ее, мы начинаем отслеживать игроков с помощью технологий компьютерного зрения. Мы следим за всеми объектами, которые находятся на льду, включая судей, но их мы из нашей базы данных выкидываем. Оставляем игроков, оставляем шайбу, отсматриваем с помощью компьютерного зрения и определенных алгоритмов, например, распознавания номера, кластеризации по цвету формы. Происходит это довольно просто: сравниваем предыдущий и следующий кадр, и, если что-то на льду поменялось, наша технология понимает, что этот объект поехал в ту или иную сторону. Координаты игроков и шайбы мы выгружаем 10, а то и 50 раз в секунду.


Камеры, с помощью которых специалисты фиксируют все, что происходит на льду
ICEBERG Sports Analytics/Youtube


Имея такой объем данных, мы можем применить несколько алгоритмов машинного обучения. Как это происходит? Мы собираем большое количество данных, скажем, за 500 или 1000 матчей, далее люди вручную размечают определенные события: пас, бросок, передвижение с шайбой — и дают компьютеру обучиться на этом объеме информации. Компьютер знает правильный вариант, что было в момент, когда у этого игрока были такие же координаты, как и у шайбы, а потом шайба стала двигаться в направлении другого игрока. Он знает, что это был пас. Такие события компьютер правильно определяет с 96-97% вероятностью. А далее мы берем, например, пас и координаты шайбы и игрока и соединяем эти два файла. Если это был пас, и шайба пересекла синюю линию, то есть перешла из средней зоны в зону какой-то из команд, то в хоккее это событие будет означать «вход в зону».

Так, погружаясь глубже и глубже, мы получаем файлы, в которых около миллиона строк данных. Мы их визуализируем на нашем аналитическом портале, там можно посмотреть интересные тренды, например, узнать, кто был лучшим игроком матча, а кто — худшим.

— Как можно такие данные использовать?

— Это зависит от типа клиента. Если рассматривать профессиональные клубы, то есть две главных цели сбора данных и применения такой аналитики. Первая — это улучшение командных результатов этого клуба, вторая — более эффективное использование денег, бюджета. Первая цель достигается за счет более объективной оценки того, как играет команда, какие у нее проблемные зоны, как улучшить игру, подобрать тактику под соперника. Таким образом игра клуба улучшается на 10-15% без покупки дополнительных игроков. Вторая цель достигается за счет более объективной оценки игроков, поиска недооцененных, продажи переоцененных.



— Кому-то еще, кроме тренеров, самих спортсменов и менеджеров команд, такая аналитика может пригодиться? Может быть, комментаторам, болельщикам?

— Комментаторам мы готовы давать какую-то аналитику перед матчем, для их pregame-шоу, обычно это достаточно скучное зрелище, особенно в хоккее. Эти pregame и postgame-шоу особенно никто не смотрит, и вообще рейтинг хоккея достаточно низок из-за того, что во время матча не видно шайбу и игру мало кто понимает. Это не вина комментаторов — проблема в том, что нет информации, и им не о чем разговаривать во время матча. Вот они видят какой-то момент, они могут про него поговорить, потом они могут во время паузы обсудить личную жизнь игрока или рассказать какую-то интересную историю из своей игровой жизни. Но чтобы рассказать обычному болельщику, что такое хоккей вообще, как в него играют, почему важно то, а не это, — такого не происходит, потому что нет информации.

Болельщики могут более интерактивно погрузиться в хоккей — наша идея в том, что им не хватает соприкосновения с игрой.



Правда, пока это касается только американского футбола, в хоккее таких технологий еще нет. То есть ты можешь смотреть матч, как будто ты один из игроков команды. Конечно, сейчас это так себе выглядит, но идея довольно перспективная. Такое размывание границ между виртуальностью и реальностью.

— Применяются ли статистические методы для других видов спорта?

— Я могу точно говорить за хоккей и за футбол — в них очень важно собирать данные и нужно применять аналитику. И вообще, если говорить абстрактно, для всех видов спорта и для всех процессов нашей жизни, в которых нужно принимать решения, очень важно иметь данные, которые могут подтвердить наше субъективное мнение. Мы планируем применить нашу систему и в других видах спорта, уйти в более широкую сферу спортивной аналитики. В наших планах есть и некомандные виды спорта, в которых собирать статистику даже проще. В теннисе, например, два игрока, и все достаточно просто. При этом, хотя там уже используется система, которая просматривает спорные эпизоды во время матча, то, что собирают в теннисе, — это очень базовая аналитика. А чтобы данные использовать для улучшения показателей, определенные компоненты игры теннисиста — такого я еще ни разу не видел, такое никто не применяет. Хотя это лежит на поверхности.


Визуализация того, как система видит игроков во время матча
ICEBERG Sports Analytics/Youtube


— А, скажем, в беге или прыжках в длину можно собирать какие-то данные, которые позволят предсказывать результаты или оценивать игроков?

— Собирать можно везде. Если брать прыжки в длину, это, например, сколько спортсмен делает прыжков за год. Допустим, за одну тренировку прыгает 20 раз, из них у него среднее было, скажем, шесть метров, максимальное было семь, минимальное четыре метра, а распределение крутится вокруг шести метров, его среднего. И есть 10% его прыжков, которые были за шесть с половиной или за семь метров. Надо понять, как ему эти 10% увеличить и что он делал такого, что именно в этих 10% у него получилось прыгнуть так далеко. Если собирать данные о силе толчка, угле наклона во время толчка, скорости разбега, много разных показателей и потом добавить в модель пять ключевых параметров и его финальный результат, то можно выяснить, что, скажем, когда он слишком сильно сгибает ноги во время отталкивания, сила толчка становится чуть ниже, и поэтому он прыгает чуть хуже. Обладая этой информацией, тренер может скорректировать тренировки, стратегию прыжка.

— Можно ли с помощью такой системы предсказать итоги отдельной игры? С какой вероятностью?

— Да, можно. С какой вероятностью? Хороший вопрос. Все зависит от объема данных по обеим командам. Если данных много, то можно предсказать с довольно неплохой вероятностью. Число я не буду заявлять, могу сказать, что лучше букмекеров. Их предсказания могут быть улучшены. Мы занимаемся этим вопросом, но это сложная задача. Еще, наверное, не один сезон пройдет до того момента, когда мы сможем официально заявить, что абсолютно любой отдельно взятый матч можем предсказать лучше букмекеров, потому что есть очень много параметров, на которые нужно сделать поправки. При этом уже сейчас мы показываем клиентам вероятность победы, она высчитывается автоматически. Они могут открыть список своих игроков, перетасовать звенья или поставить второго вратаря, и вероятность в автоматическом режиме изменится. Также есть кнопочка «максимизировать вероятность победы», тогда наш алгоритм в автоматическом режиме ищет самый оптимальный вариант игры. С одной стороны, это звучит круто, с другой, пока на практике это сильно не применяется, потому что тренерский штаб использует нашу систему в качестве инструмента-помощника, а не замены своей работе.

— Какова роль везения, мотивации игроков?
— Она достаточно велика, мы даже рассчитывали для хоккея: роль случайности в одном отдельно взятом матче порядка 40%. С одной стороны, это достаточно много, почти половина, но, с другой стороны, если уметь предсказывать и максимизировать оставшиеся 60%, то у вас очень неплохие шансы на общий успех. Предсказаний нашего алгоритма с вероятностью выше 65-70% я не видел. У нас все примерно от 40 до 60% в связи с тем, что очень большой процент удачи.


Используемая специалистами технология компьютерного зрения автоматически определяет объекты на льду
ICEBERG Sports Analytics/Youtube


Есть вещи, которые можно пусть не предсказать, но сделать поправку. Например, если у команды тяжелая серия выездных матчей, и она все матчи проигрывает, то мы делаем поправку на то, что игроки, скорее всего, в упадке и в следующем матче будут не очень хорошо играть. Но есть много факторов, о которых мы просто не знаем. Конфликты в команде, или, например, задержали автобус, и игроки не выспались из-за этого, не успели подготовиться, выйти на тренировку. Некоторые из таких вещей можно предвидеть, но для этого нужно, чтобы тренеры были сильно погружены в жизнь команды. Они должны заходить на портал и в разделе «Психология» или «Мораль» для каждого игрока выставлять определенный показатель, допустим, от одного до пяти. Технически команда может это делать, но практически никто из клубов этим не пользуется, просто потому что у них времени на это не хватает.

— А если бы речь шла о крупной ставке, доверили ли бы вы решение алгоритму?

— Я бы доверился, наверное, особенно, если бы я был уверен в модели. Я всегда доверяю компьютеру больше, чем человеку, потому что у компьютера нет чувств, а у человека есть, и это большая разница.

— А как же интуиция?

— Я, честно говоря, думаю, что она бывает, но, если брать большой объем, 100 или 1000 решений, скорее всего, компьютер выиграет. Но интуицию я не отметаю. С этим связано ключевое заблуждение, которое появляется у наших команд, клиентов и всех, кому мы рассказываем об этом. Они все боятся, что сейчас придет ICEBERG и все обсчитает так, что останутся только главный тренер и генеральный менеджер, а всех остальных уволят. Это абсолютно неправильный подход, потому что мы предоставляем дополнительный инструмент, он позволяет принимать более объективные решения, но все равно этим инструментом должен кто-то пользоваться, поэтому никого из скаутов или тренеров в бейсболе, где подобные системы начали работать более 15 лет назад, не уволили. Профессия скаута просто трансформируется, она становится более вариативной. Работа любого скаута заключается в монотонном просматривании видео матчей, но это настолько неэффективное использование времени, что аналитика поможет сделать их работу чуть более интересной и полезной для общего успеха команды.


Анимация, с помощью которой система показывает собранные во время игры геолокационные данные
ICEBERG Sports Analytics/Youtube


Есть показатели, которые невозможно просчитать, например, один из них связан с тем, здоровый ли режим у игрока, какие у него родители, есть ли у него жена и дети. Если он только вчера женился, то у него будут проблемы с переездом, какие-то другие хлопоты в голове, наверное, он будет чуть менее сконцентрирован на игре. Обладая этой информацией, скаут может делать пометку. Он интегрирует данные с игры, которые мы собираем, и такие околоспортивные вещи в единую систему. Аналитика — это просто очередной очень сильный, мощный инструмент, который сделает работу всех людей, которые есть в клубе, эффективнее.

— Сталкивались ли вы с противодействием со стороны скаутов, менеджеров старой закалки?

— Да, конечно. Но рынок меняется. Сейчас для тренеров, для скаутов, которые открыты к технологиям, есть уникальная возможность вывести свою работу и результаты команды на новый уровень, используя нашу аналитику. Сейчас она дает конкурентное преимущество, а через пять лет в невыгодном положении окажутся те команды, которые использовать ее не будут. Конечно, сопротивление есть, но где мы не видели сопротивления? Любой прогресс связан с сопротивлением людей, но это процесс, которым не управляют скауты или тренеры. Это вопрос времени, когда такую систему начнут использовать все.

— Расскажите о вашей компании. Как так получилось, что головной офис находится в Канаде, а R&D в России?

— Наша компания существует чуть более двух лет. Я довольно долго жил в Канаде, учился там в университете и не планировал возвращаться в Россию. Но в какой-то момент у меня родилась идея ICEBERG, у меня оставалось довольно много знакомых в России, я написал нескольким людям, спросил, возможно ли эту идею реализовать. В плане разработки технология непростая, и довольно мало людей в мире могут ее сделать, а как мы знаем, в России достаточно сильные программисты и сильные разработчики. Потом, когда мы создали продукт и стали продавать первую версию, мы перевели ключевые процессы в Канаду. К сожалению, особенно в плане продаж, в плане доверия компании, было немало проблем. Когда мы пытались продать наш продукт зарубежным компаниям, мы встречали сопротивление, связанное с политикой, с предвзятым отношением к России.

Продолжение материала о компьютерной аналитике читайте на сайте Indicator.Ru.


Автор — Алёна Манузина

Подписывайтесь на Indicator.Ru в соцсетях: Facebook, ВКонтакте, Twitter, Telegram.
Tags: Стартап
Subscribe

Recent Posts from This Journal

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic
  • 0 comments