Então óh, o shotgun espetado na câmera só presta para captar o som ambiente, com toda a sujeira de ruídos e/ou reverb (ambientes fechados) que lhe acompanha. A voz do youtuber só ai ficar boa se a captação for por um padrão cardioirde com um mic de menor sensibilidade aos ruídos como uma lapela ou mic de mão, bem próximo da fonte de som.
O gravador externo, além de ter qualidade de som muuuito superior, tem vários canais, controles do sinal, tracks separadas, entradas para outros mics, etc... e principalmente permite trabalhar longe da câmera, e perto da fonte do som.
Sincronizar trilha de vídeo e áudio é baba, desde a época do filme existem várias técnicas. Antigamente quem tinha dinheiro usava um claquete, e quem não tinha batia palmas. Atualmente existem sftws que sincronizam tudo automaticamente várias câmeras simultâneas e várias fintes de áudio simultâneos pra gente.
Se quer qualidade, vai de gravador externo, fica a dica!!!