Cet article analyse, dans un contexte ordinaire de formation des enseignants, la mise en œuvre d’un scénario de vidéoformation conçu par un collectif de formateurs. L’étude se focalise sur la comparaison des façons de faire d’une formatrice et d’un formateur pour susciter, mettre en place et maintenir une « attention conjointe » lors du visionnage et de l’exploitation de vidéos qui vise à construire-aiguiser le regard des enseignants-stagiaires sur des aspects professionnels particuliers non perçus par eux. A partir des films de deux séances de formation et d’entretiens d’autoconfrontation, l’analyse réalisée dans le cadre sémiologique du cours d’action (Theureau, 2004) a permis de mettre en évidence trois macro-préoccupations communes à la formatrice et au formateur et quelques divergences. La discussion, en s’appuyant sur différentes formes d’attention (Depraz, 2014) et plusieurs postures et gestes d’accompagnement des formateurs, identifie un certain nombre d’éléments qui favoriseraient un « sentiment partagé de co-présence » lors du visionnage et de l’exploitation des vidéos, exprimant un niveau élevé d’attention conjointe.