Vous êtes ici

Convertir des fichiers avec Iconv

Si vous regarder des films en VO sur votre ordinateur avec des sous titres en français ou en anglais vous voyez parfois apparaître des caractères bizarres. C'est probablement parce que la personne qui a généré le fichier utilisait un autre jeu de caractères que celui qu'utilise votre lecteur de vidéo pour lire les sous-titre.

Pour pouvoir lire vos sous-titre confortablement il vaut mieux convertir le fichier qui les contient.

Pour cela on utilse "iconv".

Il est fortement probable que ce programme soit installé sur votre système. Il fait partie entre autre du paquer "libc-bin".

Tout d'abord vérifions l'encodage utilisait par notre fichier en utilisant la commande "file" :

$ file -i Greys.Anatomy.S12E01.HDTV.x264-KILLERS_en.srt

 Nous obtenons :

$ Greys.Anatomy.S12E01.HDTV.x264-KILLERS_en.srt UTF-8: ISO-8859 text, with CRLF line terminators

Nous utilisons par défaut l'UTF-8. Et donc  si nous regardons la fin du fichier nous trouvons la séquence suivante :

Pour corriger ce soucis utlisons la commande suivante :

$ iconv -f ISO-8859-1 -t UTF8 Greys.Anatomy.S12E01.HDTV.x264-KILLERS_en.txt -o Grey.srt

Vérifions via la commande "file" :

$ file -i Grey.srt

qui donne :

$ file Grey.srt: UTF-8 Unicode text, with CRLF line terminators

Nous obtenons bien :

$ Greys.srt: text/plain; charset=utf-8

et si nous affichons la fin du fichier, nous obtenons bien :

Fait le 03/11/2016

Tags: 

Theme by Danetsoft and Danang Probo Sayekti inspired by Maksimer