J’avais besoin de récupérer tous les fichiers audio d’un site internet pour apprendre la prononciation de certains sinogrammes en chinois mandarin. Je devais pour cela me rendre sur la page du sinogramme et afficher la source pour pouvoir enregistrer le fichier audio, dans le but de pouvoir l’écouter à tous moments et sur n’importe quels supports.
J’ai donc codé un script rudimentaire pour récupérer tous les fichiers audios d’un répertoire.
Je connaissais l’emplacement des fichiers, je savais aussi qu’ils étaient en mp3, qu’ils pouvaient avoir de 1 à 6 lettres sans accent et également un chiffre à la fin pour certains. Sachant cela j’ai développé ce petit script, assez rudimentaire mais efficace.
Je n’ai pas eu de problèmes de bannissements, ni de mon FAI, ni du site en question.
Il y a 6 boucles imbriquées qui testent toutes les possibilités, c’est donc très long pour arriver à la fin du script. Il est donc important de connaître le nombre de lettres/chiffres maximum possible pour gagner du temps.
#!/bin/bash |