10 февраля в 18:19 • Высшая лига
Спойлер: будет много математики, но в такой теме без цифр никуда.
В начале немного ликбеза. Несмотря на то, что об ожидаемых голах речь пойдет не сразу, начнем мы именно с этого показателя.
Ожидаемые голы (или xG) — метрика, которая отражает созданные моменты на основании ударов по воротам. Иначе говоря, это вероятность забить мяч из какой-либо позиции. Эту вероятность оценивают десятичной дробью с максимальным значением 0.99 (из любой позиции можно промахнуться, поэтому и нет точки, удар с которой оценивался бы в 1.00 ожидаемых гола). Для еще большей наглядности возьмем конкретный пример: чемпионский удар Вадима Пигаса в матче с БАТЭ оценивался всего в 0.04 xG.
А мяч Раймонда Адеолы в ворота «Копенгагена» в Лиге Конференций — в 0.4. То есть, чем проще забить, тем выше оценивается конкретный удар.
Каждый числовой показатель складывается из следующих факторов: расстояние и угол до ворот голевого момента (координаты момента); разновидность момента (удар со стандартного положения, пенальти, выхода один на один и т. д.); бьющая нога (рабочая или нет); часть тела, которой наносится удар (нога, голова или другая часть); разновидность предшествующего моменту паса (навес, прострел и другое, а также сила). В зависимости от источника эти факторы могут меняться, но набор выше, как правило, самый базовый.
Теперь идем к «ожидаемым очкам». Это статистический показатель, который рассчитывает, сколько очков команда должна набрать благодаря своему выступлению. Он высчитывается на основе анализа опасности ударов, которые команда создала и допустила. Затем, исходя из этого анализа, подсчитывается, сколько очков команда могла бы набрать в идеальных условиях.
Вернемся в прошлый год, а именно — в уже упомянутый матч между «Динамо» Минск и БАТЭ — матч, ставший для минчан чемпионским. В той встрече подопечные Скрипченко нанесли 18 ударов (суммарно на 2.07 ожидаемых гола), борисовчане — 7 (на 0.16 xG). Такой матч в теории мог бы завершиться любым счетом от 0:0 до (чем черт не шутит) 18:7.
Здесь необходимо высчитать вероятность каждого из этих исходов (от 0:0 до 18:7), а затем с помощью формулы полной вероятности вычислить вероятность победы каждой из команд, а также вероятность ничьи (обойдемся без самой формулы, иначе текст станет совсем нудным). Все эти подсчеты нужны для получения математического ожидания набранных командой очков. Высчитав все (во избежание нагромождения текста большим количеством цифр этот расчет произведен «за кадром»), получилось, что вероятность победы «Динамо» оценена в 83 процента, победы БАТЭ — в 1, остальные 16 процентов — вероятность ничьи.
Интересующие нас ожидаемые очки считаются по формуле: «кол-во очков, получаемых за победу, умножить на вероятность победы + кол-во очков, получаемых за ничью, умножить на вероятность ничьей». В данном матче эта формула приобретает следующий вид (для «Динамо»): 3*0.83 + 1*0.16 = 2.65 (в Рустате — 2.7). Аналогичный подсчет для БАТЭ выглядит так: 3*0.01 + 1*0.16 = 0.19 (в Рустате — 0.1).
Готово — мы получили примерное количество очков, которое команда должна была набрать за матч. Дальше по ходу сезона эти показатели суммируются.
Рустатом просчитаны последние два года, поэтому на них и будем опираться. Начнем с 2023 года.
Немного пояснений:
xG — ожидаемые голы команды, xGA — ожидаемые гола соперника, ЗМ и ПМ — забитые и пропущенные мячи (реальные), xPTS — ожидаемые очки (ранжир как раз по этому показателю), О — набранные очки, реал. место — место в реальной таблице*, Δ — разница между ожидаемым и реальным местом в таблице (красный в случае, если клуб финишировал ниже, чем должен; зеленый, если получилось полное соответствие; черный, если клуб оказался выше ожидаемого).
*для объективности мы «вернули» очки, которые сняли с «Шахтера», «Энергетика» и «Белшины», и в соответствии с этим расставили команды в «реальной таблице».
По этой таблице видно, что ожидаемые очки полностью отражают отрыв «Динамо» и «Немана» от остальных команд лиги. Также эта модель прекрасно показывает яму, в которой оказалось брестское «Динамо» (спад был более чем справедливым именно по игре). И в целом фиксируем «попадание» (ноль в графе Δ) сразу у пяти команд — то есть, трети всего чемпионата.
Переходим к недавно закончившемуся турниру.
Здесь «Шахтеру» также добавили снятые очки.
Как видим, в последнем сезоне четыре команды (четверть) финишировали ровно так, как им предсказывала модель xPTS. При этом можно выделить и несколько других моментов:
«Динамо», «Неман» и «Торпедо-БелАЗ» что по реальным, что по ожидаемым очкам находятся в отрыве от всех остальных команд лиги. При этом жодинцы чемпионы. «Нафтан», «Днепр» и «Шахтер» заслуженно забрали нижние три строчки. БАТЭ небезосновательно стал в таблице лишь восьмым.
Стоит отметить и тот факт, что команды с «ключевых» строчек совпали почти полностью: первая тройка (и четвертое место, которое может дать путевку в ЕК), а также зона вылета. Внутри этих групп возможны изменения, но их состав по модели xPTS на 100 процентов совпадает с тем, что мы увидели в итоговой таблице. Да, в середине попаданий не так много, но здесь нужно учитывать и тот факт, что и плотность в этой зоне очень высокая: между седьмым и десятым местом всего три очка.
Далее рассмотрим количество матчей, исход которых совпал с тем, что нам показывают ожидаемые голы. Выборка данных — все матчи последних двух сезонов. Встречу считаем законченной в пользу одной из команд, если разница по xG между ними > 0.7 ожидаемых гола (примерно с такой разницей можно говорить о преимуществе одной из команд, а в некоторых источниках именно во столько оценивается пенальти).
Из 240 матчей Высшей-лиги в 132-х реальные результаты совпали с ожидаемыми, что составляет 55 процентов от общего числа. Годом ранее процент «совпадения результатов» был выше: из 210 встреч 127 завершились так, как посчитала модель xG (это 60,5 процентов). Если просуммировать данные за два года, то из 450 матчей «ожидаемый» результат был зафиксирован в 259 встречах — это 57,6 процента.
Поскольку действительно конкурентоспособным (при всем уважении к клубам Первой лиги) кубок становится лишь на стадии 1/8 финала, когда подавляющее большинство участников представляют Высшую лигу, то именно с этой стадии мы и начнем отсчет. Рустатом полностью просчитан лишь триумфальный для «Немана» розыгрыш, так что, особо не имея выбора, опираемся на него.
Чтобы команды были в равных условиях, ожидаемые очки будем считать в пересчете на количество сыгранных матчей. Лидерство забрали… «Неман» и «Ислочь» (2.13 и 1.57 соответственно), сыгравшие в финале. Ниже, правда, идет «Слуцк» (1.5 ожидаемых очка), вылетевший как раз в 1/8 (от «Витебска»). Дальше «Торпедо» (1.48), БАТЭ (1.33) и «Динамо» Минск (1.24), идущее достаточно низко как участник полуфинала.
В случае с национальным трофеем по модели xPTS «Неман» и «Ислочь» и правда стали лучшими командами розыгрыша, и именно они разыграли трофей. Но в общем и целом здесь попаданий меньше: и «Слуцк», хорошо проведший проигранный матч, и «Динамо», идущее действительно низко.
Если речь идет о турнире дистанционном, то можно смело опираться на эту модель. Как показало «исследование» выше, реальные результаты несильно расходятся с тем, что получилось по расчетам xG: немало команд финишировало ровно так, как высчитала модель, а еще больше в графе «Δ» +1 и -1, что говорит о совсем небольшом расхождении с реальностью. Конечно, и существенные расхождения тоже есть («Славия» в 2024 году, например), но в футбол и играют люди, а не роботы, поэтому рассчитать все в точности до 100 процентов просто невозможно.
Но в применении к кубковым соревнованиям модель xPTS гораздо реже совпадает с реальностью, и это тоже легко объясняется: в таких турнирах немало решают «случаи» и единичные моменты: перформанс вратаря, ошибка — таких факторов очень много. На длительной же дистанции (в случае БВЛ это 30 туров) влияние этих факторов «случая» сводится к минимуму, поэтому такая статистика более чем имеет место.
На ожидаемых голах и очках мы не останавливаемся, ведь к продвинутой статистике относятся не только эти показатели. Здесь заострим внимание на тех, к которым прибегаем чаще всего в своих материалах.
Одним из наиболее употребимых показателей являются продвигающие передачи, передачи в финальную треть и штрафную площадь. Продвигающая передача — пас, который перемещает мяч на расстояние девяти и более метров к воротам соперника. С передачами в штрафную и финальную треть, наверное, все и так понятно: пас, при котором мяч оказывается в чужой штрафной или атакующей трети.
Вы можете задать вопрос: а что делать с этими показателями? В случае продвигающих передач нас в первую очередь интересуют защитники и полузащитники оборонительного типа, так как игроки атаки редко занимаются продвижением мяча — они больше заточены на обострение.
Представьте любого центрального защитника. Как оценить, насколько он хорош в действиях с мячом? Если опираться исключительно на количество передач и их точность, то можно быть обманутым, ведь эти цифры могут «набиваться» исключительно путем передач ближнему, то есть другому защитнику. И вот в этом случае продвигающие передачи (в финальную треть также) очень даже применимы, так как они исчерпывающе дают понять, куда направлены эти передачи. С опорными (да и не только) полузащитниками примерно та же история: далеко не все игроки этого амплуа набирают много результативных действий, и упомянутые выше метрики могут помочь оценить вклад игроков центра поля в игру команды.
Яркий пример в данном случае — Никита Демченко. Полузащитник был очень важным игроком команды в этом сезоне (временами — вовсе бессменным), но за весь сезон у него всего один гол. А чем же он так важен? В начале зимы мы, как раз опираясь на цифры, ответили на этот вопрос.
Прямо сейчас Демченко — важный игрок «Динамо», хотя год для полузащитника начинался трудно. За счет чего удалось выйти на новый уровень
А почему Гулжигит Алыкулов с лишь 11 голевыми действиями (для команды-бронзового призера не так и много, будем честны) без каких-либо вопросов воспринимался одним из лучших игроков чемпионата независимо от клубных пристрастий? А потому, что был с отрывом лучшим по дриблингу, потому что много отдавал в штрафную и исправно создавал голевые моменты.
Еще есть такой показатель, как ожидаемые голевые передачи. То, как они работают, проще объяснить на конкретном примере: представим ситуацию, в которой Павел Седько отдаст передачу Максиму Скавышу, после которой тот нанесет удар на 0.3 ожидаемых гола. В этом случае полузащитнику добавится 0.3 ожидаемых голевых передачи.
В чем польза этой метрики? Конечно, есть и другие показатели, отражающие способности игрока креативить, и самым распространенным, как правило, являются ключевые передачи (передачи, после которых следует удар). Однако подсчет ключевых передач считает именно количество ударов после них, в то время как ожидаемые ассисты — опасность этих ударов.
В контексте Федора Лапоухова мы прибегали к такому показателю, как «вратарский бином». Это показатель, отражающий вероятность того, что другой вратарь при таком же наборе ударов пропустит больше. «Ну, и?» — спросите Вы.
Крайне часто возникают споры о том, кто же является лучшим вратарем чемпионата (любого, не только белорусского). Нередки случаи, когда таковыми называются вратари команд-чемпионов. Однако не менее редко на другую чашу весов «кладут» бедных вратарей аутсайдеров, которые в силу (скорее, слабость) своей команды выставляются буквально на расстрел. Так вот, вратарский бином, кажется, исчерпывающе дает понимание того, действительно ли крут вратарь, или это все-таки его прикрывает оборона.
Продвинутая статистика — вещь крайне полезная, но ей нужно уметь пользоваться. Нельзя взять лишь один показатель в отрыве от остальных и на его основании делать выводы. Нельзя, например, утверждать, что если одна команда превзошла другую по xG, то она обязательно должна была победить. Ведь эта модель, при всех своих плюсах, не учитывает некоторые факторы: например, удаление (команда, оставшаяся вдесятером, вряд ли будет создавать много моментов у чужих ворот, в то время как их соперник — очень даже будет). Яркий пример — первый полуфинальный матч последнего кубка Беларуси между «Динамо» и «Неманом», когда у чемпионов страны произошло удаление уже на 15 минуте (красную получил Роман Бегунов). Тот матч завершился победой динамовцев, несмотря 0.14 на 1.15 в пользу гродненцев по ожидаемым голам. Здесь скорее, наоборот, показатель говорит об отменной игре «Динамо» в обороне, ведь «Неман», больше часа играя в большинстве, создал лишь на 1.15 гола (этого с учетом хода игры было маловато).
Также нередки сценарии, когда одна из команд быстро получает преимущество в один-два (а то и больше) гола, а потом откатывается к своим воротам для защиты результата. «Гомель», например, на выезде в Гродно и вовсе собрал два сценария: тогда на 12 минуте Эффаге открыл счет, а на 70 Рылач досрочно покинул поле. Итоговые четыре ожидаемых гола у «Немана» более чем объяснимы: команда с самого начала была вынуждена отыгрываться, а потом еще четверть игры провела в большинстве.
При этом набить высокий xG можно и путем большого количества дальних ударов: они просто за счет количества в итоге дадут высокий показатель. Но ведь это не значит, что команда обязана забивать. В таком случае нелишним будет посмотреть на количество голевых моментов или xG в пересчете на удар (общее количество ожидаемых голов поделить на количество ударов) — это существенно прояснит ход матча и поможет вынести оценку справедливости его исхода.
Аналогичная картина и с, например, индексом PPDA. Нельзя сказать, что команда хорошо прессингует исключительно на основе того, что у нее низкий показатель PPDA. Вернее, можно, но это не будет полностью описывать ситуацию. Гораздо более глубокая картина получается, если PPDA будет использоваться в связке с количеством успешных попыток высокого прессинга, процентном соотношении успешных и неуспешных попыток и некоторых других.
Использование продвинутой статистики помогает, например, выявить слабые или сильные стороны команды или игрока; понять, в каких аспектах уязвим тот или иной коллектив. В ушедшем сезоне «Славия» была одной из лучших команд по доставке мяча в штрафную: четвертая — по передачам в чужую штрафную и пятая — по входам в эту зону. Однако по ударам мозыряне лишь восьмые (причем отрыв от десятой строчки лишь четыре удара). И вот получается, что «Славия» хорошо доставляла мяч в опасные зоны, но там ей не хватало решительных действий по завершению атак. Получается, слова Ивана Биончика о том, что его команда хорошо играла и действовала, но ей не хватало в завершении, не так оторваны от реальности.
Так что глубокая статистика лишь помогает современному футболу. Однако, к сожалению, в реалиях белорусского футбола ее применение достаточно узко (по сути, только для анализа сыгранных матчей и подготовки к следующим). За границей достаточно распространена стратегия «манибола» — подхода, при котором подбор игроков ведется на основе глубочайшего изучения статистических показателей за несколько лет, учета возраста и индивидуальных качеств. Самые известные (да и, пожалуй, самые успешные) примеры — английские «Брайтон» и «Брентфорд», за последнее десятилетие проделавшие путь из низших лиг Англии в элиту, а теперь стабильно выступающие там и при этом зарабатывающие на перепродаже игроков, сохраняя при этом высокие турнирные результаты.
Автор: Даниил Рудаков
Фото: bel.football. Цифровые предоставлены платформой Рустат, моменты из матчей взяты с видеоматериалов, предоставленных Рустатом
Категории
Пользователи
© «Белорусский футбол», 2013—2025г. Все права защищены. Для связи - [email protected]