Page 1 of 1
HTMLDecode
Posted: 2009-04-22 09:19:18
by baffab
Bonjour,
Je crois qu'il y a un problème avec la fonction HTMLDecode (ou alors c'est que chez moi), il me remplace ’ (apostrophe) par un caractère "à la con" (carré sous PSPad). Du coup, le fichier xml n'est plus reconnu valide par le parser php, entre autre.
A voir si il n'y a pas le même problème avec d'autres caractères spéciaux.
Merci d'avance.
Posted: 2009-04-23 08:22:48
by antp
Bonjour,
Il faudrait voir le fichier en question, mais "rsquo" ce n'est pas une apostrophe : c'est un guillemet simple, un de ceux-là : ‘ ’
Quel jeu de caractère est défini pour le fichier xml ? Il se peut que ces caractères soient issus de windows-1252, donc si le fichier est en iso-8859-1 ça ne passera pas.
Posted: 2009-04-24 06:54:37
by baffab
Lorsque je déroule le script pas à pas, si j'évalue la variable dans la liste de suivi j'ai la phrase qui commence par "M≖me s’il reste..." avant l'appel à HTMLDecode et juste après j'ai 'Même s#il reste..." (avec un carré à la place de #). Les accents sont bien convertis mais pas les guillemets simples.
La page est :
http://www.cinemasie.com/fr/fr/autres/f ... iques.html
Posted: 2009-04-25 21:59:14
by antp
Y a bien un bug on dirait... bon là j'ai vu le code du soft en vitesse, il est en peut tard donc je fatigue, mais a priori quand il trouve un code inconnu pour lui (comme rsquo) il ne le convertit pas et met un truc foireux à la place, mais je corrigerai ça pour la prochaine version.
En attendant il faut manuellement faire un stringreplace du code avant appel de la fonction htmldecode.
Bizarre qu'on ne soit encore jamais tombé sur ce bug, ou alors un truc m'échappe.
Posted: 2009-04-27 07:06:42
by baffab
C'est peut-être pas ce code qui est le plus souvent utilisé mais ' par exemple. En attentant je vais faire du stringreplace.
Merci.