Indivíduos diagnosticados com Transtorno do Espectro Autista (TEA) podem apresentar atraso no desenvolvimento do repertório verbal, como nas respostas ecoicas. É comum na prática fonoaudiológica o uso de pistas multissensoriais para estabelecer e refinar o repertório ecoico. Devido ao contexto de Pandemia da COVID-19 em 2021, o Conselho Federal de Fonoaudiologia (CFFa) determinou o uso de máscara cirúrgica ou N95 durante o atendimento ao paciente, sendo desencorajado o uso de máscaras transparentes. Nesse contexto, para mostrar ao paciente um modelo vocal visual a ser reproduzido, o CFFa orientou ao fonoaudiólogo utilizar gravações em vídeo ilustrativas de modelos vocais. Visto que existe um déficit de conhecimento empírico relacionado a essa recomendação, o presente estudo buscou verificar se pistas visuais multissensoriais apresentadas por meio de vídeos seriam eficazes para atingir acurácia de fala de respostas ecoicas em indivíduos com TEA. Participaram três crianças com diagnóstico de TEA e Apraxia de Fala na Infância. Após a obtenção dos dados de controle com cada participante (em um desenho experimental de sujeito único com sondas múltiplas), o tratamento foi implementado com a introdução da videomodelação vocal. Os dados relatados mostram que apenas um participante conseguiu atingir a precisão de desempenho programada. O presente estudo, portanto, não confirmou a eficácia do procedimento e apontou a necessidade de pesquisas empíricas adicionais para aprimorar o uso de técnicas de videomodelação para ensinar comportamento ecoico para essa população. Um ponto de partida para estudos de tais variáveis de procedimento no ensino de repertório ecoico via videomodelação é fornecido aqui.