
Eno Sarris est l'un des meilleurs analystes du baseball. Ce n'est pas mon cas.
Mais je viens du journalisme sportif et je passe beaucoup de temps à discuter de l'utilisation des données dans le sport - à la fois du point de vue des médias et du point de vue des performances de l'équipe - avec ceux qui mettent les données en jeu dans le monde entier.
Eno et moi nous sommes rencontrés pour discuter de sa carrière, de la manière dont les analyses ont changé l'écriture du baseball et de l'évolution qu'il entrevoit pour le secteur à mesure que la technologie s'intègre davantage dans le jeu.
Voici la conversation dans son intégralité :
Kevin Chroust : L'expression "analyse du baseball" figure dans votre signature électronique. Comment avez-vous fini par devenir rédacteur spécialisé dans le baseball et comment s'est déroulé le parcours qui vous a amené à vous concentrer sur les aspects les plus avancés du jeu ?
Eno Sarris : En fait, je suis un immigrant. Mes parents sont allemands et je suis arrivé dans ce pays en 1986. L'une des choses avec lesquelles j'ai eu du mal, c'est de rencontrer des enfants, de rencontrer de nouvelles personnes. L'une des choses que j'ai faites, c'est de rencontrer des gens par le biais du baseball. J'ai pu nouer des liens avec d'autres enfants. C'était très important. Je pense que pour d'autres personnes, le baseball (relie) parfois les enfants, mais pour moi, c'était comme un lien avec le pays, les gens et la culture - c'était vraiment important pour moi.
Mon beau-père représentait également quelqu'un qui aimait le base-ball. Grâce à lui, aux matchs auxquels nous assistions ensemble et à l'échange de cartes de base-ball, j'ai commencé à m'intéresser à l'évaluation des joueurs de base-ball. Il ne s'agissait pas seulement de faire semblant d'être Gary Sheffield avec le waggle et de jouer au wiffle ball, etc. C'était aussi : Comment puis-je obtenir les meilleures cartes de base-ball, comment puis-je obtenir les meilleures cartes de base-ball de mes amis et leur donner les pires cartes de base-ball ? Dès le début, il y a donc eu un peu d'analyse du baseball. Je pense que je ne m'attendais pas vraiment à devenir un joueur de baseball professionnel. Dès le début, l'analyse était donc un peu plus importante pour moi.
KC : Vous souvenez-vous d'un moment particulier où vous avez commencé à adopter les techniques analytiques avancées du baseball et à en faire une partie intégrante de vos écrits ?
ES : Je pense que la première fois que cette analyse s'est concrétisée pour moi, c'est à l'occasion d'un échange de cartes de baseball que j'ai effectué. J'avais huit ans et il y avait une carte de Barry Bonds que je voulais vraiment. L'autre gars est un fan des Braves et on vit à Atlanta, alors je me suis dit : "Bon, qu'est-ce que je vais faire ?" Je lui ai donné une carte de recrue de Mark Lemke, une carte de recrue de Jeff Blauser et une carte de Steve Avery, juste une carte normale de Steve Avery. Je lui ai dit : "Écoute, mec, je n'ai pas vraiment envie de donner ces cartes de débutants. Mark Lemke, je l'adore, mais je sais que tu n'aimes pas Barry Bonds. Il est tape-à-l'œil et tu le détestes, et je comprends. Donnez-moi cette carte de recrue de Barry Bonds. Je te donnerai ces trois très belles cartes pour celle-là".
Je pense que c'est à ce moment-là que j'ai compris que l'analyse faisait partie des raisons pour lesquelles j'aimais le base-ball. Cela m'a amené à jouer au baseball fantastique, et j'ai joué au baseball fantastique pendant longtemps avant même d'écrire. L'une des choses que je voulais faire pour gagner mes ligues fantaisistes était de lire toutes les analyses disponibles. Pour gagner toutes mes ligues fantaisistes, j'ai lu Baseball Prospectus. Je lisais FanGraphs, je lisais Rob Neyer, et même si je lisais sur le baseball, j'essayais vraiment de comprendre comment gagner ma ligue de fantasy. Il y a une petite chose que les gens ne savent pas, c'est que FanGraphs a en fait été créé par David Appelman pour qu'il puisse gagner ses ligues fantaisistes.
Je pense donc qu'il y a un moteur légitime dans les coulisses de ce que l'on peut lire sur le baseball. L'analyse que vous voyez, c'est juste des gens qui essaient de gagner leurs ligues de fantaisie.
KC : On entend parfois dire que toutes les données disponibles ruinent le baseball. Comment réagissez-vous à cela ?
ES : Je suis sensible à l'idée que quelqu'un qui ne veut pas lire de données pense qu'il y en a peut-être trop, et je constate qu'elles sont de plus en plus omniprésentes. De plus en plus de personnes les utilisent dans leurs écrits. Pour cette personne, je dirais qu'il y a toujours d'excellentes analyses, d'excellents articles d'opinion. Il y a encore d'excellents chroniqueurs qui font du bon travail et ils peuvent les lire.
Pour moi, la façon dont j'apprécie le baseball, je pense que les chiffres ne font que l'enrichir. (On pourrait dire : "Oh, Mike Trout est un joueur extraordinaire et il réunit toutes ces qualités." C'est très bien, mais si je peux établir un chiffre et dire qu'il est le meilleur de tous les temps jusqu'à l'âge de 27 ans, je pense que c'est une bonne chose. C'est très bien, mais si je peux rassembler des chiffres et dire qu'il est le meilleur de tous les temps jusqu'à (l'âge de) 27 ans, je pense que c'est plus convaincant. Vous pourriez dire : "Oh, hier soir, dans le match, quelqu'un a fait une superbe réception en courant jusqu'au mur et c'est la meilleure réception que j'aie jamais vue". Eh bien, ce n'est que votre parole. Tu me dis juste, "Oh, c'est l'une des meilleures prises que j'ai jamais vues."
Et si vous pouviez dire qu'il a couru plus vite que n'importe qui sur une prise cette année, que la probabilité de prise était la plus faible et qu'il a sauté le plus haut ? C'est désormais possible. Nous pouvons vous dire qu'il a sauté le plus haut pour attraper ce ballon. Je trouve cela plus convaincant. Je pense que cela vous donne une idée du contexte et de la place de cet événement dans l'histoire, et je pense que cela ajoute à la narration. Cela n'enlève rien à l'histoire. Cela fait partie de la narration de l'histoire dans son ensemble. Je pense que les chiffres font partie intégrante de l'histoire en ce moment.
KC : Le journalisme sportif - et le journalisme en général - connaît depuis quelque temps une période de redécouverte. Comment l'avez-vous abordé en tant qu'individu ?
ES : En fait, je n'avais pas envisagé de devenir journaliste sportif en grandissant. Par conséquent, je ne suis pas sûre de pouvoir parler de tous les journalistes, du chemin parcouru par le journalisme et de son avenir. Mais pour moi, le journalisme consiste à trouver des questions et à y répondre. Si vous n'utilisez pas de données, que faites-vous ? On ne peut compter que sur le bouche-à-oreille. C'est ce qu'il y a de bien avec les données. Elles vous donnent une autre voix. Je pense qu'une question convaincante est la caractéristique principale de tout bon article. Pourquoi ce joueur est-il si bon ? Ce joueur va-t-il continuer à être bon ? Est-ce que cela a de l'importance dans ce match de baseball ? Ces questions, je pense, sont la clé d'une bonne histoire.
Pour répondre à ces questions, je ne pense pas que les données soient la seule chose à faire. Je pense qu'il faut parler aux joueurs parce qu'ils ont leur propre point de vue et que les données doivent parfois rattraper ce que les joueurs voient. Je pense qu'il faut parler à la direction. Je pense que vous voulez avoir une idée de ce qui se passe à 10 000 pieds d'altitude, mais si vous ne demandez pas les données, vous manquez une façon plus objective d'analyser et de répondre aux questions. Oui, je pense que vous avez toujours besoin de personnages et que vous devez toujours plonger en profondeur dans ce qui fait de ces personnes ce qu'elles sont.
KC : Dans le journalisme, le terme "accès" a toujours fait référence au reportage sur place, principalement pour l'accès aux sources. L'accès constant aux données ajoute une couche à cela. Comment évaluez-vous l'importance de l'accès ?
ES : Je pense que ce qui est difficile pour moi, c'est que je sais que les équipes avec lesquelles je discute ont accès à des données auxquelles je n'ai pas accès. C'est parfois un problème pour moi, car je sais qu'elles ont un regard légèrement différent sur le jeu. Ils ont plus d'analystes sur le sujet et ils ont plus de données et des données différentes des miennes, donc c'est parfois une partie de l'accès qui me frustre.
KC : Je repense à l'époque où j'écrivais des articles sur le sport, avant l'utilisation des données, et ce processus d'écriture ou ce niveau de détail me semblent si rudimentaires aujourd'hui. Je me rends compte à quel point les données pertinentes peuvent être essentielles au processus. Comment décririez-vous l'avantage qu'il y a à apprendre ce genre de choses en amont et en aval comme vous l'avez fait ?
ES : J'ai eu de la chance. La façon dont je vois le baseball, la façon dont je digère le baseball est devenue plus populaire au fil des ans, je pense. J'étais un homme de chiffres d'abord. J'étais un adepte de la fantaisie. La fantaisie est devenue plus populaire, donc les chiffres sont devenus plus intéressants. Je pense qu'au début, les chiffres n'étaient que des éléments du dos de la carte de base-ball qui n'étaient peut-être pas aussi convaincants. Il n'y avait que les RBI, les courses - et qu'est-ce qu'il y avait de plus ? Aujourd'hui, nous avons ouvert la porte à Statcast et aux gens qui assistent au match et qui peuvent convertir ce qu'ils voient en chiffres, comme ils le font à Stats Perform. Nous pouvons désormais répondre à davantage de questions. Nous pouvons maintenant faire beaucoup plus avec les données et il est beaucoup plus important de les inclure dans vos écrits.
L'une des premières grandes avancées a été le Wins Above Replacement. C'était une chose intéressante parce qu'elle nous permettait de rassembler les choses disparates qu'un joueur fait sur le terrain et de les mettre en un seul chiffre, mais l'une des choses que je n'aime pas à ce sujet, c'est que cela devient une chose à un seul chiffre.
Je pense qu'il n'est pas toujours possible de résumer les gens à un chiffre, tout comme vous ne pouvez pas me résumer au nombre exact de clics qu'a obtenu mon dernier article. Je ne veux pas non plus être jugé sur la base d'un seul chiffre. Je pense que les statistiques basées sur un seul chiffre ont montré qu'elles n'étaient pas toujours révélatrices. C'est pourquoi nous nous sommes éloignés de WAR en tant que communauté analytique et avons commencé à la diviser en questions plus petites avec des réponses plus petites et des statistiques différentes qui vous disent quelque chose de différent. Aujourd'hui, il s'agit un peu plus de : Quelle est sa vitesse de sprint et quelle est son importance ? Quelle est la vitesse de son saut lors de l'attrapé et quelle est son importance ?
KC : Parlons de certains des projets les plus intéressants que vous avez réalisés récemment. Qu'est-ce qui vous vient à l'esprit et quelles sont les mesures les plus significatives avec lesquelles vous avez travaillé ?
ES : L'une de mes statistiques préférées avec laquelle j'ai travaillé récemment a été créée par Stats Perform et s'appelle command+. Elle répond à une question à laquelle vous n'auriez jamais pu répondre avec les mesures traditionnelles. Elle nécessite une grande variété d'analystes qui regardent le match. Il faut être capable de coder ce qui se passe dans chaque match et d'effectuer des recherches pour vous dire : "Ce lanceur a-t-il fait exactement ce qu'il voulait avec cette balle ?". Il est extrêmement difficile de répondre à cette question.
C'est quelque chose que la plupart des analystes ont abandonné parce qu'ils peuvent dire "Je ne peux pas être dans la tête du lanceur". Je pense qu'une chose - bravo à Stats Perform - est qu'ils ont pris une question à laquelle ils pensaient que personne ne pouvait répondre et qu'ils ont essayé une approche différente, en essayant vraiment d'entrer dans la tête du lanceur et en essayant de lui donner du crédit pour avoir façonné une balle courbe. Il peut s'agir d'une balle, mais elle peut avoir la forme qu'ils voulaient et se trouver à l'endroit qu'ils voulaient - ce qui, selon moi, est la véritable définition du commandement.
KC : Tu as écrit un article sur Zac Gallen des Marlins. Vous avez aussi écrit quelque chose sur la mesure de l'efficacité d'un slider. D'où viennent ces idées ?
ES : Quand je regarde un match, je me pose des questions. Je ne sais pas si c'est parce que je suis arrivé dans ce pays et que je me posais des questions sur ce pays. Je me demandais : "Qu'est-ce que ce nouvel endroit ? "Quel est ce nouvel endroit ? Quel est ce nouveau jeu ? C'est un nouveau jeu extraordinaire. Je l'adore." Quand je regarde un match, l'annonceur dit souvent quelque chose comme "le changeup de ce lanceur est bon ou mauvais" et je me dis : "Pourquoi ? "Pourquoi ? Qu'est-ce qui fait que ce changeup est bon ? Qu'est-ce qui fait que ce changeup est mauvais ? Peut-on mettre des chiffres là-dessus ? Pouvons-nous observer certaines catégories de ce qui rend les joueurs bons ou mauvais ?"
C'est, je pense, ce qui motive une grande partie de mes écrits. Je regarde les statistiques en essayant de répondre à des questions sur le jeu. En ce qui concerne Zac Gallen, je disais simplement que c'est un joueur qui arrive. Il a été échangé contre un excellent espoir de frappe. Il a été échangé contre une équipe qui avait besoin de jeunes joueurs. Pourquoi a-t-il été échangé, et qu'est-ce que l'Arizona voit chez ce joueur qui est différent de ce que Miami voit peut-être chez ce joueur ? J'essaie de rassembler les différents éléments et de répondre à cette question.
KC : L'opinion et la personnalité font partie de l'écriture du base-ball depuis le début. Il est possible qu'elles aient toujours leur place dans la rédaction sportive, mais dans quelle mesure est-il nécessaire que les médias aillent plus loin et soutiennent mieux leur travail ?
ES : Je pense qu'en général, les lecteurs préfèrent qu'on réponde à une question d'une manière qu'ils reconnaissent, soit parce qu'ils ont été à l'école et qu'ils ont vu quelqu'un devoir prouver sa réponse dans un document ou avec des données dans une situation similaire, soit dans leur environnement de travail. Si vous faites une présentation dans un environnement professionnel et que vous n'avez pas de données, que faites-vous ? Vous ne répondez pas à la question à laquelle vous essayez de répondre. Vous ne convainquez personne.
Lorsque j'essaie de convaincre quelqu'un de quelque chose, je commence généralement par les données. Si j'écris sur la qualité du contrat de Manny Machado et que je me contente de dire que je pense qu'il est généralement un mauvais joueur et que son contrat est donc mauvais, je pense que les lecteurs d'aujourd'hui n'y verront que du feu. Ils diraient qu'il s'agit d'un texte d'opinion et qu'il n'est pas aussi objectif que nous le souhaiterions. C'est l'une des choses que les gens attendent du journalisme et que nous recherchons depuis longtemps : l'objectivité. Je pense que les données vous donnent vraiment la possibilité d'être ce journaliste objectif parce que vous utilisez les données comme une source objective dans vos articles.
KC : Quel impact aurait, selon vous, l'utilisation appropriée des données dans un article que vous écrivez sur le niveau d'engagement des lecteurs ? Diriez-vous que cela fait également une différence en termes de crédibilité auprès des lecteurs ?
ES : C'est intéressant. Parfois, je me fais engueuler parce que j'écris des chiffres. Je pense que pour la plupart, cela leur permet aussi de m'engager parfois. Certains de mes lecteurs me disent : "Vous avez raté quelque chose, vous n'avez pas regardé ce chiffre, vous n'avez pas regardé ce chiffre". Vous n'avez pas regardé ce chiffre." Je trouve que c'est une conversation de plus haut niveau que "Tu détestes Manny Machado et c'est mon joueur préféré, va-t'en". Je pense que le fait de nous permettre d'avoir une conversation plus objective - c'est quelque chose qui est en train de se produire dans le baseball également.
Vous constaterez que les joueurs d'aujourd'hui sont beaucoup plus ouverts aux statistiques. Cela s'explique en partie par le fait qu'ils veulent s'améliorer et qu'ils voient maintenant que les statistiques peuvent les aider à s'améliorer. La conversation ne se limite donc plus à dire : "Hé, mec, tu as un très mauvais slider, améliore-le". Désormais, la conversation est la suivante : "Hé, prends ce slider et peux-tu changer l'axe de rotation ? Pouvez-vous mettre vos doigts dans cette direction ? Lisons ce que dit la machine. La machine va nous dire si c'est bon ou mauvais et nous n'aurons pas à nous engueuler". Il y a un peu de cela, je pense, dans la rédaction sportive et la lecture en général - les chiffres vous permettent de nous donner quelque chose à débattre qui est plus objectif, mais aussi moins subjectif entre nous.
KC : Nous avons parlé hors caméra du fait que nous sommes tous les deux, au moins dans une certaine mesure, passionnés de football. Traditionnellement, le football est loin derrière les sports américains pour ce qui est de l'utilisation correcte des données, parce qu'il est plus difficile de le segmenter de manière significative et objective qu'un sport comme le baseball. Cette situation a commencé à s'inverser avec l'apprentissage automatique et la capacité à mettre en œuvre l'intelligence artificielle pour analyser des ensembles de données massives que les humains ne peuvent pas structurer seuls. Cela a donné lieu à des "mesures attendues" qui sont plus prédictives que tout ce qui a été fait auparavant. Pensez-vous que l AI aura un impact similaire sur le baseball à l'avenir ?
ES : Le base-ball étant un sport très segmenté, on peut l'arrêter à tout moment et dire : "Combien y a-t-il de retraits, où sont les coureurs, sont-ils en première ou en deuxième position ? Cela permet de nombreuses recherches semi-professionnelles. Cela permet aux gens qui peuvent simplement télécharger un ensemble de données de faire leurs propres recherches, et cela a en fait alimenté beaucoup d'intérêt pour le baseball en termes de lecture. La sabermétrie repose sur cette idée. La SABR est la Society for American Baseball Research. Il s'agit de chercheurs semi-professionnels qui effectuent leurs recherches de leur propre chef, et beaucoup d'entre eux sont maintenant passés dans la sphère privée et travaillent pour des équipes de base-ball.
Je pense que lorsque la puissance de calcul dépassera ce que l'on peut faire soi-même, il y aura un changement. Cela pourrait ressembler un peu à ce qui se passe dans le football, parce qu'il n'y aura pas autant de passionnés qui feront l'analyse du football parce qu'ils n'auront pas la puissance de calcul nécessaire. Ce dont vous avez besoin, c'est d'un fournisseur qui puisse intervenir pour vous et vous aider dans cette analyse et vous la fournir, et pas seulement aux front offices. Nous avons besoin de ces sources de données professionnelles qui sont également disponibles pour les lecteurs. Nous avons besoin de ces sources de données professionnelles qui ne sont pas seulement derrière et qui travaillent pour des équipes afin de remplacer les chercheurs semi-professionnels qui existaient auparavant.
L'une des choses les plus intéressantes en ce moment dans le baseball, c'est que nous passons de la technologie radar à la technologie optique... pour décrire ce qui se passe avec les membres. La technologie radar ne pouvait pas faire la différence entre une balle, une batte et un bras. Désormais, nous allons disposer d'une technologie optique qui pourra vous dire ce que font les bras, les jambes et le corps. Je pense qu'il nous faut maintenant comprendre un peu plus la biomécanique.
C'est ce que j'essaie de faire. J'essaie déjà de lire sur la biomécanique, d'apprendre la biomécanique parce qu'on va apprendre à utiliser le corps de façon optimale. Nous serons alors en mesure de dire avec plus de certitude où un bras doit se trouver, où la batte doit se trouver à un certain moment de l'élan, et nous disposerons de plus de données relatives à ce genre de choses dans la sphère publique et dans la sphère privée. Je pense que nous allons parler davantage de la façon dont les corps se déplacent dans l'espace.