[REL] [EN] [FR] Centralisation ScorEpioN [-SEN-]
Ok, mais comme je ne tombais plus que sur des exemples utilisant , je me suis dit: de toute façon il faut une solution pour les 2 et exclure la partie qui varie dans le findInfo.antp wrote:C'est une espace insécable, code 160 dans le jeu de caractère Windows.
Tu pourrais faire ceci pour les remplacer par des espaces classiques :
s := StringReplace(s, Chr(160), ' ');
(où s est la variable qui contient la page complète téléchargée)
-
- Posts: 863
- Joined: 2006-08-31 23:58:18
@ kurosu
ASIN (Amazon Standard Identification Number) est un code d'identification de produit utilisé par Amazon et uniquement Amazon.
EAN (European Article Numbering) est un code-barres utilisé par le commerce et l'industrie partout dans le monde.
@ antp
Salut antp,
Ça marche oui, d'ailleurs l'option "Type de lancement -> 2 Demande L'ASIN" est inutile puisqu'avec l'option 0 tu peux tout aussi bien faire la recherche sur le titre, l'EAN ou L'ANSI. Par contre ces 2 références ne sont pas identiques.kurosu wrote:OK, j'avoue que ne le voyant pas sur la fiche produit, que ça marche *aussi* sur le numéro ASIN (d'où l'url de base) et finalement que je croyais ce numéro très local, m'avait donné l'impression que c'était juste un problème de nom. Après, il suffit de mettre "ASIN ou EAN", et ça sera bon.
ASIN (Amazon Standard Identification Number) est un code d'identification de produit utilisé par Amazon et uniquement Amazon.
EAN (European Article Numbering) est un code-barres utilisé par le commerce et l'industrie partout dans le monde.
Ça, Je peux essayer d'en faire une.kurosu wrote:Quand j'aurais compris comment on affiche une liste de choix de films (genre allociné), sans doute y remettrais-je les mains
Le charset de la page est effectivement sensée être en iso-8859-1 ... sauf qu'il y a plein de caractères encodés en UTF8kurosu wrote:J'ai testé aussi en copiant-collant la chaîne et avec TF8Decode/Encode (pas utile normalement vu que la page est sensée être en ISO8859-1x), et pareil. Mais comme y a des tags HTML pour lier aux fiches des individus, autant nettoyer et prendre la partie qu'on sait alors correct. Et comme les 2 formats (  et l'autre) sont présents, ça marche mieux aussi.
@ antp
Salut antp,
Comment as tu fait pour déterminer de quel caractère il s'agissait ?antp wrote:C'est une espace insécable, code 160 dans le jeu de caractère Windows.
Tu pourrais faire ceci pour les remplacer par des espaces classiques :
s := StringReplace(s, Chr(160), ' ');
(où s est la variable qui contient la page complète téléchargée)
Il me faudrait alors plutôt fusionner titre et EAN, car le numéro ASIN saute directement à la page sans recherche.Raoul_Volfoni wrote:Ça marche oui, d'ailleurs l'option "Type de lancement -> 2 Demande L'ASIN" est inutile puisqu'avec l'option 0 tu peux tout aussi bien faire la recherche sur le titre, l'EAN ou L'ANSI. Par contre ces 2 références ne sont pas identiques.
Cf. plus bas, j'ai fait une mise à jour que tu peux utiliser comme base.Ça, Je peux essayer d'en faire une.kurosu wrote:Quand j'aurais compris comment on affiche une liste de choix de films (genre allociné), sans doute y remettrais-je les mains
Je me suis retrouvé à éviter de faire des matchs avec des caractères problématiques, plus simple.Le charset de la page est effectivement sensée être en iso-8859-1 ... sauf qu'il y a plein de caractères encodés en UTF8
J'aurai personnellement sauvé le fichier et utiliser un éditeur hexadécimal.@ antp
Salut antp,
Comment as tu fait pour déterminer de quel caractère il s'agissait ?antp wrote:C'est une espace insécable, code 160 dans le jeu de caractère Windows.
Tu pourrais faire ceci pour les remplacer par des espaces classiques :
s := StringReplace(s, Chr(160), ' ');
(où s est la variable qui contient la page complète téléchargée)
Voici la version 15 qui réintroduit les infos que j'avais retiré, corrige la recherche de durée (même problème), et regarde la page commentaires pour faire la moyenne des étoiles et la ramener sur 10. Je n'ai pas beaucoup testé cette dernière fonctionnalité pour vérifier si c'est robuste.
@antp (hors-sujet, mais bon)
Pour les images, ne serait-il pas possible d'attendre la confirmation qu'on veut remplacer le champs en question avant de télécharger ladite image? Car si on annule pour une raison ou une autre, l'image a été téléchargée pour rien.
-
- Posts: 863
- Joined: 2006-08-31 23:58:18
Je suis reparti de ta première version, mais ça ne devrait rien changer, par rapport à ce que tu as rajouté.kurosu wrote:Cf. plus bas, j'ai fait une mise à jour que tu peux utiliser comme base.
Alors pêle mêle, j'ai rajouté de quoi faire apparaitre une liste lorsque l'on tape un titre ou bien que l'on récupère le titre depuis le champ titre traduit ou original.
La liste qui apparait contient pour chaque ligne :
- le type de support (DVD, Bluray etc ...)
- l'Année de sortie du média
- Le titre du média expurgé du type de support
Dans les options, j'ai viré ce qui n'était plus utile car le code en rapport n'est plus présent dans le script: Mise à jour, Fichier Log.
J'ai fait le ménage dans l'option "Type de lancement" il n'y a plus que trois choix possible :
- 0 -> Demande le titre, code ANSI, Code EAN ou URL avant de lancer le script
- 1 -> Ne demande pas le titre avant de lancer le script
- 2 -> Lancement automatique sur l'adresse web
Avec l'option à 0, on peut donc rentrer soit un Code ANSI, un code EAN, une URL ou bien un titre, dans ce cas une liste de films apparaitra, sauf si il n'y a qu'un seul résultat.
J'ai rajouté 3 nouvelles options:
1 - Nettoyer le titre : (Permet de nettoyer le titre pour ne garder que le titre et rien d'autre)
- 0 -> Non
- 1 -> Oui
2- Contenu Additionnel : (Permet de mettre ou non tout le contenu additionnel dans le champ commentaires)
- 0 -> Non
- 1 -> Oui, dans le champ Commentaires
3- Détails sur le produit : (je savais pas trop comment l'appeler celle la ... permet ou non de récupérer les langues, sous-titres et Nbr de disques)
- 0 -> Non
- 1 -> Oui, importe Langues, Sous titres et Nbr de disques dans les champs respectifs
Ces trois options sont à 0 par défaut.
J'ai récupéré le type de média pour le mettre dans le champ "Type de support".
J'ai rajouté la récupération de la note à partir de la page principale
J'ai changé la manière de récupérer le synopsis.
Plus deux trois trucs par ci par là ... :P
Je n'ai pas touché la partie concernant la récupération de l'image, parce que je vois pas trop comment faire pour récupérer au possible l'image HIres, tout en étant sûr que ce soit la jaquette recto.
Le script Amazon (FR).ifs en V16.
J'avais fait ça aussi de mon côté, ça évite de chercher ce qu'on aurait pu oublier de gérerRaoul_Volfoni wrote:Dans les options, j'ai viré ce qui n'était plus utile car le code en rapport n'est plus présent dans le script: Mise à jour, Fichier Log.kurosu wrote:Cf. plus bas, j'ai fait une mise à jour que tu peux utiliser comme base.
L'intérêt (faible) du numéro ASIN est de construire immédiatement l'url sans passer par une page de recherche.J'ai fait le ménage dans l'option "Type de lancement" il n'y a plus que trois choix possible :
- 0 -> Demande le titre, code ANSI, Code EAN ou URL avant de lancer le script
- 1 -> Ne demande pas le titre avant de lancer le script
- 2 -> Lancement automatique sur l'adresse web
Le code à cet endroit était bizarre (dupliqué) et ne marchait pas chez moi.J'ai rajouté 3 nouvelles options:
1 - Nettoyer le titre : (Permet de nettoyer le titre pour ne garder que le titre et rien d'autre)
- 0 -> Non
- 1 -> Oui
J'ai remis 'recupTitreRecherche' (sans doute issu des utils de scorepion) et fait pour que ça marche chez moi. Plus quelques typos ici et là qui faisaient planter le script avec certaines options.
Merci pour les changements, c'était pas mal de boulot!
Effectivement, j'ai juste rajouté une option pour le type d'image qu'on souhaite, mais le code est ptet pas très robuste.Je n'ai pas touché la partie concernant la récupération de l'image, parce que je vois pas trop comment faire pour récupérer au possible l'image HIres, tout en étant sûr que ce soit la jaquette recto.
J'ai en outre géré le dernier élément 'result_?_empty' qui faisait apparaitre une ligne disgracieuse dans la liste.
Le script Amazon (FR).ifs en V17.
-
- Posts: 863
- Joined: 2006-08-31 23:58:18
Le code dont tu parles n'a rien avoir avec l'option Nettoyer le script.kurosu wrote:Le code à cet endroit était bizarre (dupliqué) et ne marchait pas chez moi.
J'ai remis 'recupTitreRecherche' (sans doute issu des utils de scorepion) et fait pour que ça marche chez moi.
Si c'est dupliqué ... enfin cleané dans un certain sens, c'était pour une bonne raison. Je me servais de la fonction cleantitle2 avant cleantitle car sinon cela ne nettoie pas entièrement le titre lorsque l'on prend l'option type de lancement à 2.
En remettant 'recupTitreRecherche' tu fais déjà un cleantitle puisque la fonction recupTitreRecherche effectue un cleantitle à la fin.
Enfin bon tu fais comme tu veux.
Sinon j'ai essayé ta version V17 d'abord avec un code EAN et je ne récupère aucune adresse web dans ce cas ... j'ai pas testé avec un code ASIN.
Mais le plus gênant c'est que je ne récupère plus aucunes réponses lorsque je fais une recherche par un titre ... à la place j'ai une belle liste vide !! Je ne sais pas pourquoi tu as changé les conditions de la boucle, mais chez moi ça ne marche pas du tout ... je crois que je vais rester avec ma V17 sur laquelle j'ai fais une modif sur la partie synopsis et rajouté un choix pour l'option "Casse Choisie"
Voici le script si tu veux incorporer ces modifs, mais je ne suis pas reparti de ta V17.
Amazon (FR)_V17_R_V.ifs
Le script Amazon (FR).ifs en V17.Raoul_Volfoni wrote:Mais le plus gênant c'est que je ne récupère plus aucunes réponses lorsque je fais une recherche par un titre ... à la place j'ai une belle liste vide !! oh well Je ne sais pas pourquoi tu as changé les conditions de la boucle, mais chez moi ça ne marche pas du tout ...
Edit: corrigé un bug justement avec ce _empty final
-
- Posts: 863
- Joined: 2006-08-31 23:58:18
Ok j'ai pas testé à fond, mais c'est déjà beaucoup mieux concernant la recherche par le titre
J'ai pas trop le temps de tester le reste, mais pense à changer la partie récupération du synopsis par ça, sinon pas mal de synopsis ne sont pas récupérés :
Et rajoute le choix (4 -> Formatage identique au site d'origine)(et le mettre par défaut) pour l'option "Casse Choisie", ceci afin d'eviter des bizarreries sur les chiffres romains avec l'option à 3 comme par exemple :
Ii à la place de II
Vi à la place de VI etc ...
Comme tu as pu le remarquer, j'ai supprimé et edité ton double post afin que ce soit plus lisible
J'ai pas trop le temps de tester le reste, mais pense à changer la partie récupération du synopsis par ça, sinon pas mal de synopsis ne sont pas récupérés :
Code: Select all
// Synopsis
if CanSetField(fieldDescription) then
begin
if Pos('Synopsis</h3>', Line) > 0 then
begin
Synopsis := DecodeUTF(findInfo('Synopsis</h3>', '</div>', Line, '4'));
end else
begin
if Pos('>Voir l''ensemble des Descriptions du produit</a>', Line) > 0 then
begin
Line2 := findInfo('<div class="seeAll">', '>Voir l''ensemble des Descriptions du produit</a>', Line, '4');
Line2 := findInfo('<a href="', '"', Line2, '4');
Line2 := GetPage(Line2);
Line2 := findInfo('<h2>Descriptions du produit</h2>', '>Retourner à l''aperçu du produit</a>', Line2, '4');
Delete(Line2, Pos('<!--', Line2), (Pos('<![endif]-->', Line2)+12)-(Pos('<!--', Line2)));
Synopsis := DecodeUTF(findInfo('Synopsis</h3>', '</div>', Line2, '4'));
end;
end;
HTMLRemoveTags(Synopsis);
HTMLDecode(Synopsis);
MonSetField(fieldDescription, Fulltrim(Synopsis));
end;
Ii à la place de II
Vi à la place de VI etc ...
Comme tu as pu le remarquer, j'ai supprimé et edité ton double post afin que ce soit plus lisible
Last edited by Raoul_Volfoni on 2013-03-13 22:30:28, edited 1 time in total.
merci d'avoir édité ma réponse, j'ai cafouillé dans mon édition.
Quand le nombre de films trouvés par amazon est sous un seuil, le dernier item est de la forme result_?_empty et ne contient rien. J'ai modifié pour prendre en compte ça mais du coup ça ne marchait plus dans le cas classique. désolé
Sinon, ton bloc de code 'dupliqué' me retournait une chaine vide au contraire de l'ancien code et comme toi avec le problème ci-dessus que tu as eu avec mon code, j'ai remis celui qui marchait pour moi.
édit: nos réponses se croisent. je verrai tes suggestions a partir de demain. Merci encore
Quand le nombre de films trouvés par amazon est sous un seuil, le dernier item est de la forme result_?_empty et ne contient rien. J'ai modifié pour prendre en compte ça mais du coup ça ne marchait plus dans le cas classique. désolé
Sinon, ton bloc de code 'dupliqué' me retournait une chaine vide au contraire de l'ancien code et comme toi avec le problème ci-dessus que tu as eu avec mon code, j'ai remis celui qui marchait pour moi.
édit: nos réponses se croisent. je verrai tes suggestions a partir de demain. Merci encore
-
- Posts: 863
- Joined: 2006-08-31 23:58:18
Bizarre ... ... ça le faisait avec n'importe quel titre ? ou tu as un exemple particulier. Parce que chez moi, sur le peu de titres que j'ai testé, je n'avais pas ce problème.kurosu wrote:Sinon, ton bloc de code 'dupliqué' me retournait une chaine vide au contraire de l'ancien code et comme toi avec le problème ci-dessus que tu as eu avec mon code, j'ai remis celui qui marchait pour moi.
En tous les cas si tu restes comme ça, tu peux supprimer le "CleanTitle" de la 2ème ligne, car il est déjà effectué au dessus dans la fonction "recupTitreRecherche"
Code: Select all
MovieName := recupTitreRecherche(GetOption('Recherche sur le titre'));
MovieName := CleanTitle(CleanTitle2(MovieName));
J'ai sauvé la page en local et ouvert le fichier avec un éditeur hexa.Raoul_Volfoni wrote: Comment as tu fait pour déterminer de quel caractère il s'agissait ?
Au lieu de 0x20 (32, l'espace) il y avait 0xA0 (160), je suis allé vérifier sur Wikipedia que ça correspondait bien à l'espace insécable dans le jeu de caractères Windows
Avec CanSetPicture (de mémoire) le script peut savoir si on a coché la case pour pouvoir remplacer l'image.kurosu wrote: @antp (hors-sujet, mais bon)
Pour les images, ne serait-il pas possible d'attendre la confirmation qu'on veut remplacer le champs en question avant de télécharger ladite image? Car si on annule pour une raison ou une autre, l'image a été téléchargée pour rien.
Après si dans la fenêtre de résumé on la décoche, oui on l'a téléchargée pour rien, mais vu que dans cette fenêtre de résumé on peut voir l'image en question on n'a pas trop le choix : il faut bien l'avoir téléchargée pour la voir (et ça serait compliqué à modifier pour ne la télécharger que quand on est vraiment sûr d'en avoir besoin)
Merci à tous et surtout à Raoul, pour tout le travail effectué, tant sur allociné que sur amazon. Je reviens après une longue absence... Et je constate que le script allociné que j'utilise principalement, marche bien, à part un tout petit ennui: J'ai choisi de récupérer tous les secrets de tournage. Mais dans ce cas, je récupère 2 fois le 1er(je pense 1 fois sur la page principale et 1 autre fois sur la page des secrets de tournage complets.... Ce n'est pas très grave, mais je dois à chaque fois en effacer 1. Bon y a pire dans la vie, mais si le lumineux Raoul, ou tout autre, voit quelle ligne du script il faudrait modifier.... ça me faciliterait la vie!!!
Merci d'avance pour toute réponse. A+
Merci d'avance pour toute réponse. A+
-
- Posts: 863
- Joined: 2006-08-31 23:58:18
Salut cloclo,
C'est bizarre ... je ne peux malheureusement pas vérifier ce qui se passe et je ne pourrais rien faire avant samedi prochain :-(
Si tu recupères les secrets de tournage complet, le script ne s'interresse pas du tout à la page principale et va directement sur la page contenant tous les secrets. C'est pourquoi je pense que les conditions de la boucle de récupération des infos ont du changer et le script doit boucler 2 fois sur le premier secret ... mais ce n'est qu'une supposition.
C'est bizarre ... je ne peux malheureusement pas vérifier ce qui se passe et je ne pourrais rien faire avant samedi prochain :-(
Si tu recupères les secrets de tournage complet, le script ne s'interresse pas du tout à la page principale et va directement sur la page contenant tous les secrets. C'est pourquoi je pense que les conditions de la boucle de récupération des infos ont du changer et le script doit boucler 2 fois sur le premier secret ... mais ce n'est qu'une supposition.
-
- Posts: 863
- Joined: 2006-08-31 23:58:18
Mise à jour Allociné V117
Salut à tous,
Voici une nouvelle mise à jour du script Allociné (V117).
Vous pouvez mettre à jour le script avec les deux méthodes habituelles :
- Automatique, en utilisant le script : [ UPDATE SCRIPTS ] (recommandé pour tous et surtout les utilisateurs de Vista et Seven)
- Manuelle, en téléchargeant le script à l'endroit habituel : http://update.antp.be/amc/scripts/
Au menu :
- Correction d'un problème de boucle dans la récupération des secrets de tournage complet dont le premier secret était récupéré 2 fois.
- Correction mineure d'un problème de décodage de caractères dans les critiques spectateurs pour la partie film et série du script.
Voici une nouvelle mise à jour du script Allociné (V117).
Vous pouvez mettre à jour le script avec les deux méthodes habituelles :
- Automatique, en utilisant le script : [ UPDATE SCRIPTS ] (recommandé pour tous et surtout les utilisateurs de Vista et Seven)
- Manuelle, en téléchargeant le script à l'endroit habituel : http://update.antp.be/amc/scripts/
Au menu :
- Correction d'un problème de boucle dans la récupération des secrets de tournage complet dont le premier secret était récupéré 2 fois.
- Correction mineure d'un problème de décodage de caractères dans les critiques spectateurs pour la partie film et série du script.
-
- Posts: 863
- Joined: 2006-08-31 23:58:18
Mise à jour Allociné V118
Salut à tous,
Voici une nouvelle mise à jour du script Allociné (V118).
Vous pouvez mettre à jour le script avec les deux méthodes habituelles :
- Automatique, en utilisant le script : [ UPDATE SCRIPTS ] (recommandé pour tous et surtout les utilisateurs de Vista et Seven)
- Manuelle, en téléchargeant le script à l'endroit habituel : http://update.antp.be/amc/scripts/
Au menu :
- Ajout du choix "4 -> Batch : désélectionne films traités / décoche + sélectionne films non traités" dans l'option "Type de lancement"
Ce nouveau choix de l'option "Type de lancement" permet de traiter une grande quantité de fiches ayant uniquement le titre original ou traduit, sans avoir à rester devant son écran pour valider les choix possibles (le script récupère uniquement les infos des films ayant un seul résultat de recherche sur le site Allociné). Les films qui ne sont pas traités sont alors décochés et sélectionnés* afin de pouvoir relancer le script une deuxième fois (avec le choix 2) sur les fiches non traités et finir le boulot "manuellement". (* Version 4.1.2 d'AMC uniquement)
La méthode :
- Pour que le mode batch fonctionne, il faut décocher "Afficher les résultats" dans les options d'exécution du script (en haut à droite dans la fenêtre scripting)
- Dans la fenêtre du programme AMC, sélectionner les films à inclure dans la liste de films (ou se servir des différents choix des "films à inclure" à droite de la fenêtre scripting) et appuyer sur la touche F6 pour lancer la fenêtre scripting.
- Choisir le script Allociné (V118 ou au delà).
- Choisir le type de Lancement "4 -> Batch : désélectionne films traités / décoche + sélectionne films non traités"
- Lancer le script ... Si tout se passe bien, le script devrait récupéré les infos des films qui ne présente qu'un résultat et il décochera les fiches non traitées. Il va également les sélectionner automatiquement si vous utilisez une version 4.1.2 et au delà d'AMC. Si c'est votre cas et que vous avez décochez "Fermer à la fin" des options d'execution, vous pourrez alors relancer le script immédiatement en mode "2 -> Ne demande pas le titre avant de lancer le script" pour finir le boulot. Sinon, pour les utilisateurs de version d'AMC antérieur, il faut revenir sur la fenêtre principale du programme et sélectionner les films non traités en cliquant droit sur la liste des films et en choisissant :
Et voilà ..
Cet ajout fait suite à cette discussion.
Voici une nouvelle mise à jour du script Allociné (V118).
Vous pouvez mettre à jour le script avec les deux méthodes habituelles :
- Automatique, en utilisant le script : [ UPDATE SCRIPTS ] (recommandé pour tous et surtout les utilisateurs de Vista et Seven)
- Manuelle, en téléchargeant le script à l'endroit habituel : http://update.antp.be/amc/scripts/
Au menu :
- Ajout du choix "4 -> Batch : désélectionne films traités / décoche + sélectionne films non traités" dans l'option "Type de lancement"
Ce nouveau choix de l'option "Type de lancement" permet de traiter une grande quantité de fiches ayant uniquement le titre original ou traduit, sans avoir à rester devant son écran pour valider les choix possibles (le script récupère uniquement les infos des films ayant un seul résultat de recherche sur le site Allociné). Les films qui ne sont pas traités sont alors décochés et sélectionnés* afin de pouvoir relancer le script une deuxième fois (avec le choix 2) sur les fiches non traités et finir le boulot "manuellement". (* Version 4.1.2 d'AMC uniquement)
La méthode :
- Pour que le mode batch fonctionne, il faut décocher "Afficher les résultats" dans les options d'exécution du script (en haut à droite dans la fenêtre scripting)
- Dans la fenêtre du programme AMC, sélectionner les films à inclure dans la liste de films (ou se servir des différents choix des "films à inclure" à droite de la fenêtre scripting) et appuyer sur la touche F6 pour lancer la fenêtre scripting.
- Choisir le script Allociné (V118 ou au delà).
- Choisir le type de Lancement "4 -> Batch : désélectionne films traités / décoche + sélectionne films non traités"
- Lancer le script ... Si tout se passe bien, le script devrait récupéré les infos des films qui ne présente qu'un résultat et il décochera les fiches non traitées. Il va également les sélectionner automatiquement si vous utilisez une version 4.1.2 et au delà d'AMC. Si c'est votre cas et que vous avez décochez "Fermer à la fin" des options d'execution, vous pourrez alors relancer le script immédiatement en mode "2 -> Ne demande pas le titre avant de lancer le script" pour finir le boulot. Sinon, pour les utilisateurs de version d'AMC antérieur, il faut revenir sur la fenêtre principale du programme et sélectionner les films non traités en cliquant droit sur la liste des films et en choisissant :
- - Pour utilisateurs de version 3.5.1.2 ou antérieur, Sélect. non cochés
- Pour les utilisateurs de version 4.0 et postérieur, les films devraient déjà être sélectionnés, sinon, Sélectionner -> Non cochés
Et voilà ..
Cet ajout fait suite à cette discussion.