Navigation rapide

A cause des différents standard entre les OS et les différents systèmes, récupérer et traiter du texte peut se révéler être un véritable casse-tête en Python.

Il existe cependant un ensemble de fonctions et de méthodes tailler pour nous faciliter la vie.

Symbole unicode

Juste pour rappel, une petite liste des principaux symbole unicode :

  • \n : retour à la ligne
  • \t : tabulation

Texte vers string brut avec la fonction repr()

Cette fonction permet de transformer un texte interprété (tenant compte des retours chariot par exemple) en texte « brut »
Exemple, avec ce texte contenant des retours à la ligne :

Python
est
un
super
langage
de
programmation

…sera transformé par la fonction repr() comme ceci :

>>> 'Python\nest\nun\nsuper\nlangage\nde\nprogrammation\n'

Noter que repr() renvoie une string qui doit être stocké dans une variable.

Texte vers liste avec la méthode .split()

La méthode .split() permette deux chose à la fois : elle transforme une string en liste en la « découpant » sur un ou des caractères que l’on définie.

Exemple :

my_text = "Numéro de sécurité sociale:123456789"
print(my_text.split(":"))

>>> ['Numéro de sécurité sociale', '123456789']

On peut même aller plus loin en ciblant directement un index dans la liste générer pour récupérer une partie de la string de départ. Le résultat est donc une nouvelle string :

my_text = "Numéro de sécurité sociale:123456789"
result = my_text.split(":")[-1]
print(result)
print(type(result)

>>> 123456789
>>> <class 'str'>

Texte vers liste avec la méthode .splitlines()

Cette méthode permet de convertir un texte en liste en « coupant » chaque mot après un \n :

contenue = "texte\ntexte2\ntexte3".splitlines()
print(contenue)

>>>  ['texte', 'texte2', 'texte3']

Capitaliser avec .upper()

contenu = "capitaliser".upper()
print(contenu)

>>> CAPITALISER

« Décapitaliser » avec .lower()

contenu = "DECAPITALISER".lower()
print(contenu)

 >>> decapitaliser

Ajouter une majuscule en début de phrase avec .capitalize()

contenu = "et la majuscule bordel !".capitalize()
print(contenu)

>>> Et la majuscule bordel !

Ajouter une majuscule à chaque lettre avec .title()

contenu = "ass hole style".title()
print(contenu)

>>> Ass Hole Style

Remplacer une partie de texte avec .replace()

contenu = "Maya c'est vraiment le top pour la modé".replace("le top", "de la merde")
print(contenu)

>>> Maya c'est vraiment de la merde pour la modé

Vérifier la fin d’une string avec .endswith()

contenu = "pornhub.com".endswith("com")
print(contenu)

>>> True 

Checker le début d’une string avec .startswith()

contenu = "Python rocks".startswith("Python")
print(contenu)

>>> True

0 commentaire

Laisser un commentaire