Utilité de passer sous un bon éditeur de texte

Depuis de nombreuses années que je travaille dans l’informatique et le SEO, j’ai été amené à constater que l’outil indispensable est l’éditeur de texte.

On peut faire des choses exceptionnelles avec une rapidité fulgurante. Si les secrétaires étaient un peu formées à ces outils, elles pourraient certainement gagner en productivité.

En fait, c’est très simple : dès que vous avez des listes, des données dans des formats un petit peu hors des standards, l’éditeur de texte est le couteau-suisse qu’il vous faut.

Montrons un exemple qui illustrera quelques fonctionnalités.

J’utilise Sublime Text, mais il y a des nombreux autres logiciels, plus ou moins puissants.

J’ai par exemple ces données publiques (reprise ici par Aufeminin):

J’aimerais juste les noms des villes.

1 – Je copie le tableau de la première à la dernière cellule.

Si je colle sur un tableur, c’est compliqué : il reste le lien et les parenthèses

2 – Je colle dans mon éditeur de texte :

C’est barbare aussi, les données n’ont plus les liens et sont séparées par des tabulations. Mais en 2 étapes je vais avoir ma liste.

J’appuie sur CTRL-H pour faire des rechercher-remplacer.

Je vais cliquer sur l’étoile pour saisir des expressions régulières ou regex et je vais remplacer toutes (Replace All)  les tabulations (\t en regex) par des retours à la ligne (\n en regex).

Cela me donne :

On va transformer avec la même technique les espaces (dans Find j’ai mis un espace, on ne le vois pas sur la capture) par un saut de ligne

Belle liste, il n’y a plus qu’à la trier et à enlever tout ce qui est inutile :

Ctrol + Shift + P : pour activer la console de commande

On tape Sort et on sélectionne la suggestion « Sort Lines »

Bam : 

Ah Mince, en remplaçant les espaces on a cassé Le Havre et Le Mans

Quelques ctrl-z pour revenir avant notre erreur, et on remplace non plus un espace mais un espace suivi d’un début de parenthèse :  » \( » en regex pour être sûr :

Et voilà une belle liste :

Je le refais en me chromètrant :

25 secondes ! Pas mal !

Maintenant challenge : faire différemment pour garder les villes dans l’ordre. Il va falloir procéder plus finement.

1 / Avant la ville on va rechercher un nombre suivi d’un point et d’une tabulation pour remplacer ça par rien

La regex est donc : « [0-9]+\.\t »

  • [0-9]+ un nombre = un chiffre [0-9], éventuellement plusieurs (+)
  • Le point « \. »
  • La tab « \t »

Ensuite pour ce qui est après la ville, la chaine commence par  » ( » (soit donc en regex  » \(« ) et comprend ensuite toute sorte de caractères « .+ »

Et bam !

Voilà un petit exemple avec un tour des fonctionnalités le plus utiles. On se sert aussi souvent de dédoublonnage, des transformations de Casse…

Quelques heures passées sur éditeur de texte, ainsi que sur la syntaxe des regex vallent vraiment la peine pour gagner en productivité. Tout est ensuite possible, sur des fichiers gigantesques avec bien plus de souplesse et de puissance que les tableurs.

Un commentaire