Le cercle heuristique du processus stratégique. La jouabilité des jeux de stratégie

Cet article est un extrait de mon mémoire de maîtrise déposé en 2010 (p. 80-89).

L’élément central de mon mémoire de maîtrise est la description du cercle heuristique du processus stratégique. C’est en reprenant l’idée d’un rapport circulaire à la jouabilité que Bernard Perron a proposé que j’ai cherché à créer cette figure expliquant la jouabilité de StarCraft et des jeux de stratégie en temps réel. Pour mettre en évidence la stratégie en temps réel, c’est la dimension heuristique du processus de la stratégie qu’il fallait illustrer.

Ainsi, des cycles heuristiques d’Arsenault et Perron, j’ai retenu l’idée que le joueur pense l’ensemble de son expérience du jeu sur deux axes : comme une progression dans le temps et comme un maîtrise de plus en plus grande de la jouabilité. En adaptant le cercle heuristique de la jouabilité, j’ai créé le cercle heuristique du processus stratégique pour parler des jeux de stratégie en temps réel. Voici la figure en question:

Le cercle heuristique du processus stratégique

Un modèle à trois niveaux

Le plan stratégique opérationnel est la stratégie effective à un moment donné. La partie débute et le joueur peut avoir en tête son ouverture, qui devient sa stratégie opérationnelle. Ce plan stratégique (regroupé dans un schéma) permet de diriger les compétences sensori-motrices pour exécuter une action et modifier l’état du jeu immédiat. Puisque le joueur connaît d’avance le résultat habituel de l’ordre qu’il donne, cet état du jeu est modifié avant même que l’action ait été complétée voire débutée. Cet état du jeu immédiat confirme que la stratégie opérationnelle employée fonctionne.

À partir de la rencontre d’unités adverses, ou par une bonne connaissance du jeu, le joueur va inférer un état du jeu possible à partir duquel il pourra anticiper un état du jeu futur. En envoyant un éclaireur, il peut constater que son adversaire construit une expansion rapide. À partir de cette rétroaction, un certain nombre de plans stratégiques sont mobilisés. D’abord, dès l’état de jeu inféré, certains plans stratégiques se mobilisent par habitude. Puis, en anticipant ce que son adversaire fera, le joueur pourra créer un plan stratégique projeté, lequel contribuera à modifier l’anticipation des actions futures de l’adversaire. Ce plan projeté n’a pas à se baser sur une anticipation qui va jusqu’à la fin de la partie : il s’agit plutôt d’un moyen fonctionnel de savoir quelles stratégies doivent être mobilisées. Face à cette expansion rapide, le joueur pourra anticiper que l’armée de l’adversaire arrivera plus tard et choisir d’attaquer rapidement ou de construire lui aussi une expansion de manière sécuritaire. J’ai choisi d’intégrer les plans stratégiques dans une zone pointillée de l’ensemble des schémas du joueur, lesquels incluent d’autres types de connaissances enclenchées durant une partie (les règles du jeu, par exemple).

C’est notamment à partir du plan projeté qu’un ensemble de plans sera mobilisé. Les plans mobilisés sont des séquences d’actions à entreprendre à une échelle plus précise pour que le plan projeté fonctionne et qui devront changer au fur et à mesure que les circonstances le réclameront, selon le regroupement en items qui a déjà été fait. Il peut s’agir de faire une expansion, de construire un Stargate, d’avoir une armée de Zealots, de développer la technologie qui les rend plus rapide, etc. Ces plans mobilisés deviendront chacun leur tour le plan opérationnel : la capacité de multitâche enclenchera à tour de rôle chacun des plans selon l’action nécessaire à un temps donné, selon la priorité suivant le plan projeté ou selon les habitudes du joueur.

À un moment donné, celui-ci pourrait par exemple avoir comme plan projeté d’obtenir l’avantage économique à moyen terme et au moins trois plans mobilisés précis : un plan macro économique (construire deux expansions une à la suite de l’autre), un plan macro militaire (continuer à produire des Dragoons avec ses deux Gateways) et un plan micro (lancer de petites escarmouches sur l’adversaire pour déstabiliser son armée) ; chaque plan sera chacun son tour la stratégie opérationnelle — parfois pour quelques secondes — et le joueur voudra que les trois soient efficaces. Lorsqu’il aura ses deux expansions, son plan projeté lui indiquera de nouveaux plans mobilisés — par exemple, défendre ses expansions ou déplacer ses armées.

Les plans mobilisés peuvent contribuer à inférer l’état du jeu : le fait qu’il faille à un moment précis construire une expansion ou déplacer son armée implique que le joueur assume (ou souhaite) qu’après son exécution, l’adversaire réagisse d’une façon précise, plus ou moins déjà connue dans plusieurs cas.

Le plan opérationnel peut aussi être modifié par le processus ascendant, c’est-à-dire, lorsque la perception guide l’action et modifie les cadres. Si le joueur se fait attaquer de manière impromptue, il tentera le plus rapidement possible de réagir, sans nécessairement que sa réaction fasse partie des plans mobilisés et du plan projeté choisis. Ainsi, les plans opérationnels ne sont pas nécessairement des plans qui ont été mobilisés ; ils peuvent être rendus opérationnels par habitude. La situation peut se régler rapidement, sans trop de problèmes, mais elle peut aussi accaparer tellement l’attention du joueur que son plan projeté ne fonctionne plus avec l’état du jeu immédiat. Il devra dans ce cas inférer un nouvel état du jeu à partir de ce qu’il en perçoit pour que le cycle s’enclenche à nouveau au second niveau.

Le processus descendant — où les cadres dominent — ne concerne ni l’exécution, ni les compétences procédurales. Avoir une stratégie opérationnelle dirige la perception de l’état du jeu. Le regard du joueur sera plus ou moins limité aux unités qu’il juge le plus pertinent de faire agir suivant sa stratégie actuelle. Dennis Holding disait à peu près la même chose à propos des échecs : « Peu importe la forme de représentation qu’il utilise, il est clair, ou du moins fortement suggéré par les preuves que l’on a, qu’un joueur considère sélectivement certains ensembles de l’échiquier à la fois. Sa sélection — ou zone d’orientation — imaginée, souvenue ou vue semble limitée aux pièces ou cases les plus actives » (1985, p. 65, je traduis).

Par exemple, le joueur peut avoir une stratégie opérationnelle qui accapare son attention au point où il ne remarquera pas d’autres éléments pertinents du jeu. C’est sur ce principe que se base la tactique du harcèlement, c’est-à-dire lancer de petites escarmouches à des endroits qui obligent l’adversaire à réagir : en ciblant les ouvriers, par exemple. La stratégie opérationnelle normale sera de réagir, soit d’aller défendre les ouvriers. Mais cette action peut occuper le joueur assez pour qu’il oublie ce qu’il voulait faire au départ, ou encore, pour qu’il ne se rende pas compte qu’il se fait attaquer ailleurs en même temps. En changeant les attentes du joueur adverse, il interrompt sa pensée. Holding ajoute au fond que, ce qui accapare la pensée, c’est ce qui est le moins probable:

Un événement hautement probable (et, en conséquence, hautement prévisible) ne contribuera que peu à ajouter de l’information lorsqu’il arrivera, alors qu’un événement improbable y contribuera grandement (Holding 1985, p. 78).

Ainsi, si un état du jeu va dans la lignée des plans stratégiques projetés, mobilisés ou opérationnels, ceux-ci ne seront pas perturbés ; si un état de jeu n’a pas été prévu par ces plans, le joueur va au contraire devoir accorder une grande importance à ces événements pour modifier chacun des niveaux de sa stratégie, en même temps ou chacun leur tour.

Lorsqu’un joueur débute une partie, il a parfois un plan projeté basé sur un état de jeu anticipé. Il peut connaître son adversaire et prévoir déjà quelques-unes des actions que celui-ci pourrait entreprendre. Il peut aussi vouloir forcer le jeu dans une direction avec un all-in, c’est-à-dire une stratégie d’ouverture qui risque de le faire perdre rapidement si son adversaire est en mesure de la contrer. Dans plusieurs circonstances, le joueur débute avec les mêmes stratégies opérationnelles, mobilisées et projetées qu’à l’habitude et il cherchera des informations dans le jeu avant de s’engager dans une direction précise.

Pour conclure sur l’explication de ce schéma, et avant de pouvoir l’utiliser pour une analyse, il nous semble essentiel de préciser deux points. D’abord, il faut expliquer comment l’état du jeu peut être inféré et anticipé dans une direction plutôt qu’une autre, à partir de la notion de mondes possibles décrite par Umberto Eco. Ensuite, il est nécessaire d’ajouter quelques remarques sur les plans stratégiques, à partir du système de cadres qu’exposait Marvin Minsky.

Les mondes possibles et les états du jeu immédiat, inféré et anticipé

L’état du jeu immédiat est perçu et en partie construit. Comme le champ montré au joueur n’est pas l’ensemble de l’espace et que l’ensemble du champ n’est pas nécessairement perçu, une partie de cet espace est assumé par habitude.

Pour Eco ([1979] 1985, p. 63), un texte est composé d’espaces blancs que le lecteur peut remplir au moins par deux moyens : par son encyclopédie ou par son « travail inférentiel ». L’encyclopédie est l’ensemble des possibilités permises par les règles du jeu, acquises par l’expérience (p. 148) : ce que j’ai appelé répertoire à la suite d’Arsenault et Perron (2008, p. 122). C’est l’ensemble des habitudes que le joueur connaît. Par inférence, ce dernier va remplir les espaces qu’il ne peut percevoir. Une partie de cette inférence est une habitude enregistrée dans son encyclopédie, c’est-à-dire que, par exemple, en voyant des Valkyries, un joueur sait que son adversaire a construit les bâtiments qui précèdent cette unité dans l’arbre des technologies. Selon le moment où les Valkyries sont déployées et d’autres informations pertinentes — la construction d’une ou plusieurs expansions, par exemple —, il pourra faire l’hypothèse que l’adversaire a un certain nombre d’autres unités en jeu qu’il n’a pas vu. Comme pour la détection d’habitudes, l’encyclopédie concerne les règles du jeu elles-mêmes — les bâtiments préalables nécessaires — et les habitudes de jeu d’un joueur terran — le fait que les Valkyries ne soient jamais seules. Tous ces indices permettent au joueur de combler les espaces vides, de créer un ensemble de mondes possibles.

Pour Eco, un monde narratif est un ensemble limité d’individus avec des propriétés tout aussi limitées ([1979] 1985, p. 166). Un lecteur va prendre des informations au fur et à mesure de sa lecture pour construire un monde possible, lequel remplit les espaces blancs et anticipe ce qui peut se produire.

Les individus d’un monde peuvent être « préconstruits » (Eco [1979] 1985, p. 169), dans la mesure où le texte qui les active chez le lecteur se fonde sur des éléments que ce dernier connaît déjà. Le discours ne précise que certaines propriétés de ces individus, le reste pouvant être inféré par le lecteur. Par exemple, si un texte qui met en scène un monde contemporain parle d’une jeune femme de vingt-cinq ans, le lecteur assume qu’elle a probablement deux bras et deux jambes, qu’elle a une certaine connaissance des choses du monde mais qu’elle n’a pas vécu les années 1960, etc. Évidemment, plusieurs textes — dont « Un drame bien parisien » qu’analyse Eco (p. 255-286) — vont jouer sur ces inférences pour surprendre le lecteur.

Durant une partie de StarCraft, le joueur construit un ensemble de mondes possibles en fonction de son encyclopédie et de son travail d’inférence. Il faut noter que ce monde n’a pas nécessairement grand-chose à voir avec le monde réel, puisque lorsque le joueur connaît suffisamment le jeu, le recours au monde réel comme outil de comparaison est moins fiable. Dans cette optique, l’ensemble des mondes possibles ne s’élargit pas chez le joueur expérimenté, il tend au contraire à se rétrécir, parce que ces mondes sont parfois créés par habitude. Contrairement au lecteur, cet ensemble de mondes possibles doit être construit rapidement par le joueur qui adaptera son jeu suivant ces mondes.

En comparant l’acte de lecture à celui d’un joueur d’échecs, Eco note que le travail se fait en deux temps : l’ensemble des mouvements possibles, d’abord, puis le choix d’un mouvement pertinent ([1979] 1985, p. 148). Comme nous l’avons noté, ce travail est trop long pour un joueur d’échecs, qui ne retient que quelques mouvements possibles selon son habitude de jeu. Dans le contexte des STR, cette habitude doit se mobiliser encore plus rapidement.

L’application d’une connaissance conditionnelle — quoi faire dans telle situation — est parfois basée sur un état du jeu qui n’est pas immédiat, mais inféré. Plus les mondes inférés sont complets et précis par rapport à la situation de jeu, plus le joueur pourra prendre des décisions efficaces dans le cas où ils s’avèrent être près du monde actuel mais plus il sera difficile de s’adapter dans le cas où le travail d’inférence n’a pas vu juste.

La recherche sélective et les plans stratégiques projetés, mobilisés et opérationnels

S’il y a trois « niveaux » de plans stratégiques qui peuvent être impliqués dans le processus stratégique, le plan opérationnel est en fait un plan mobilisé utilisé en temps réel. Les plans mobilisés sont au pluriel car ils font partie de l’arsenal de plans opérationnels possibles, utilisables à un temps donné. Les plans projetés sont légèrement différents, parce qu’ils impliquent une situation à un peu plus long terme. D’une manière ou d’une autre, chacun de ces plans a été sélectionné parmi un ensemble plus grand de plans, qui font partie de la mémoire à long terme du joueur, de son répertoire de plans stratégiques possibles.

On l’a vu, aux échecs comme à StarCraft, la conception d’un ensemble de coups pertinents peut se faire par habitude. Mais le choix de la stratégie ne se fait pas que par des automatismes. Pour Neil Charness, si une recherche doit se faire, elle doit être une recherche sélective dans les possibilités de jeu (1977, p. 36). À partir d’une situation précise (immédiate ou inférée), comment savoir quels plans sont les mieux adaptés à la situation? Comment choisir une nouvelle stratégie parmi un ensemble de possibilités sans passer par l’ensemble des mondes possibles suivant les règles?

La méthode des cadres peut illustrer la recherche d’un plan optimal dans un jeu de stratégie (Minsky 1975, p. 258). Une situation précise peut être rattachée à différents cadres qui sont différentes actions possibles déjà expérimentées et emmagasinées dans la mémoire à long terme. Chacun de ces cadres doit être rapidement évalué pour que le bon soit choisi.

Une situation de jeu peut parfois être résumée en une seule expression, laquelle regroupe différentes possibilités ayant toutes la caractéristique d’être reliées à cette expression — disons, toutes les stratégies pour contrer une situation d’enfermement. Le joueur possède un résumé de chaque plan stratégique d’enfermement — pour mieux naviguer entre eux —, mais il conserve aussi des informations plus en profondeur (Minsky 1975, p. 260). Par exemple, si un joueur écarte une stratégie en faveur d’une autre dans une situation précise, il peut vouloir garder en mémoire les raisons de ce choix, dans l’optique de ne pas répéter les mêmes erreurs. Pour agir rapidement, il n’a besoin que d’un résumé des cadres qui font partie du système qu’il mobilise, c’est-à-dire qui s’adaptent à l’état du jeu immédiat, inféré ou anticipé.

À partir d’un état de jeu immédiat, si aucune stratégie opérationnelle ne s’impose à lui par le processus ascendant, le joueur sélectionnera un plan stratégique approprié suivant la situation actuelle, à partir de ces résumés. Les plans stratégiques mobilisés et projetés sont sélectionnés d’une manière semblable à partir des états de jeu inférés et anticipés.

Conclusion

J’ai expliqué dans de nombreux billets les concepts les plus pertinents pour
expliquer le processus stratégique dans une partie de StarCraft. Il sera essentiel, dans un prochain billet, de faire ressortir par une analyse formelle des situations de jeu qui peuvent corroborer cette théorisation de la stratégie.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *