Я недавно написал пост, в котором привел статистику по итогам первой части чемпионата России. Напомню основные выводы: «Спартак» входит в тройку лучших команд по владению мячом, количеству передач, точности передач; является лидером по ударам по воротам, занимает четвертое с конца место по ударам по своим воротам и является лидером по разнице ударов.

Все эти показатели говорят о том, что команда играет хорошо и заслуженно лидирует. Это не мои домыслы; есть аналитический пост (на английском), показывающий, что в ведущих европейских лигах, включая российскую, наблюдается существенная положительная корреляция между:

а) владением мячом и набранными очками

б) владением мячом и разницей ударов по воротам

в) разницей ударов по воротам и набранными очками

Другими словами, ситуацию можно описать так: команда, которая владеет мячом, контролирует ход игры; команда, которая контролирует ход игры, наносит много ударов по воротам соперника и допускает мало ударов по собственным воротам; команда, у которой хорошая разница ударов, чаще побеждает.

В то же время сейчас среди аналитиков принято считать, что модели ожидаемых голов (xG), которые присваивают разным ударам разный вес, предсказывают результаты лучше, чем модели, основанные просто на ударах по воротам.

Вот один пример (чем левее точка, тем лучше модель; последняя модель, All shots equal, — это и есть просто удары, а все остальные модели — это разные типы xG):

Вот еще пример (чем выше линия, тем лучше модель; красным показана модель xG, желтым — простые удары по воротам):

Сильно углубляться в детали я здесь не хочу, кому интересно и кто знает английский, может почитать по ссылкам.

Интересно все вышесказанное в свете того, что в Твиттере пользователь  выложил интересные картинки по итогам осенней части РФПЛ. Вот первая картинка. Здесь по горизонтальной оси показана разница ожидаемых голов за игру (чем правее, тем лучше разница), по вертикальной — «удача», т.е. реализация моментов командой и ее соперниками (чем лучше реализует моменты данная команда и чем хуже ее соперники, тем она выше, детали здесь):

Видим, что «Спартак» по разнице ожидаемых голов идет всего лишь на 7-м месте, но зато очень удачлив.

Вот вторая картинка. По горизонтальной оси показано число нанесенных ударов по воротам соперника, во вертикальной — их качество (среднее xG за один удар):

Видим, что «Спартак» очень много бьет по воротам соперника, но среднее качество ударов низкое. «Зенит» бьет по воротам меньше, но из гораздо более выгодных позиций.

Вот третья картинка. По горизонтальной оси показано число допущенных ударов по своим воротам, во вертикальной — их качество (среднее xG за один удар):

Видим, что «Спартак» мало дает бить по своим воротам, но когда дает, то из очень хороших позиций.

Другими словами, если брать модель xG под авторством 11tegen11, получается, что «Спартак» — это скорее середняк, которому много везет, чем уверенный лидер. Более того, у команды не все получается в атаке (много ударов, но не очень хороших) и не очень надежная оборона (хоть соперники и бьют по воротам «Спартака» редко, но качество этих ударов высокое). Соответственно, если верить этой модели, то «Спартак» занимает не свое место и, если игра команды не улучшится, должен откатиться вниз в таблице.

Получается интересный статистический казус: есть две модели (условно говоря, первая основана на владении мячом, вторая — на ожидаемых голах), которые обычно хорошо предсказывают результаты команды. И необычность нынешнего «Спартака» в том, что он очень хорош, если верить первой модели, но сильно уступает тому же «Зениту», если верить второй.

Мне сложно сказать, чем этот казус вызван, но стоит отметить, что «Ростов», который плохо выглядит в модели xG, второй год показывает достаточно хорошие результаты. Может быть, дело в том, что модель xG не очень применима к России (например, в плохую погоду и на плохих полях удары издали опаснее; или же в России нападающие плохо реализуют «качественные» шансы); может быть, модель xG в целом верна, но отдельные команды/тренеры могут ее «перехитрить» (лучше блокируют удары, лучше выводят своих игроков на удар, лучше готовят вратарей); может быть, модель xG недооценивает «Спартак», потому что судьи не ставят пенальти в ворота соперников (а должны были поставить как минимум 5 или 6, что дало бы прибавку где-то в 0,2 xG за матч), но «Спартак» все равно как-то вырывает победы, несмотря на судейство.

Возможных объяснений много, и я не хочу спорить о том, какая модель лучше и почему. Я склоняюсь к тому, что «Спартак» играет хорошо, и его результаты закономерны, но переубеждать никого не собираюсь.

А вообще, было бы очень интересно спросить Массимо Карреру, как он относится к современной аналитике и, в частности, моделям xG. Даже если нам не нравятся выводы модели 11tegen11, стоит отметить, что на него в Твиттере подписан Унаи Эмери, который в футболе немножко разбирается.