[REL] [FR] Allociné v2

If you made a script you can offer it to the others here, or ask help to improve it. You can also report here bugs & problems with existing scripts.
Tistitoo
Posts: 6
Joined: 2016-03-26 16:58:39

Post by Tistitoo »

Retour d’expérience et un peu plus d'explications,

Après avoir remis la version 2.25,
essai sur plusieurs fiches (nouvelle ou ancienne), même message d'erreur à peine lancé le script.

j'ai pu contourné plus ou moins ce probleme en allant sur le site d'allociné avec FireFox !!

Ex: d'une fiche déjà récupéré,
Je copie l'adresse web du champ AMC dans firefox et la surprise, petit test pour savoir si je suis un bots
ou un humain. passé ce test j'arrive sur la page du film d'allociné, je lance le script Allocine_FR_v2 d"AMC,
a présent j'arrive à récupérer quelque champs mais pas la totalité !! je click sur l'onglet casting sur allociné,
je relance le script et Là j'arrive à récupéré les autre champs + les extras acteurs et actrices.Même manip
pour les extras photos du film, je click sur l'onglet Photo quand il y'en a.

Ex: d'une nouvelle fiche,
je fais une recherche sur allociné avec FireFox du titre du film, je copie l'adresse Dans le champ AMC,
je vais dans l'onglet casting sur allociné ou directement photo du film, puis je lance le script Allocine_FR_v2, et la aussi
j'arrive à récupéré les infos en totalité!!!

Conclusion:
Je suis obligé d'aller sur le site d'allociné, sur la page du film que je veux récupéré (passé le test de bots de temps à autre)
pour pouvoir exécuté, à peu près correctement le script !! ( IP Blacklisté ).
Last edited by Tistitoo on 2016-11-20 10:46:24, edited 1 time in total.
LeMoi
Posts: 171
Joined: 2006-04-09 11:26:43

Post by LeMoi »

Au passage, à mon dernier essai il y a 4 jours, aucun souci de mon côté, j'ai oublié de le dire, merci Raoul ^^
Tistitoo
Posts: 6
Joined: 2016-03-26 16:58:39

Post by Tistitoo »

Raoul_Volfoni wrote:Tu peux essayer de chercher directement sur leur site avec ton navigateur et voir si tu obtiens des résultats ... si oui il faudrait que tu puisses changer le user agent du navigateur :D
Merci mille fois Raoul_Volfoni pour ton aide !!!
Je m’apprêtais à essayé ta solution pour éclaircir mes doutes sur mon affaire d'ip blacklisté !! Comme par miracle, aujourd’hui tout fonctionne à merveille !!! nouvelle et ancienne fiches !!!! Allez savoir :??:
Encore merci aux contributeurs du sript !! :)
Ragenetik
Posts: 7
Joined: 2016-11-26 18:22:41

Post by Ragenetik »

Bonjour, ça faisait au moins 2 semaines que je n'avais pas utilisé AMC, j'ai mis le script à jour, je viens pour ajouter un film à ma liste et le script ne fonctionne pas. Ça me donne 2 erreurs HTTP/1 .1 403 Forbidden et j'obtiens aucune infos. Un peu comme Tistitoo, j'ai été sur leur site et en accédant au divers onglets j'ai réussis à récupérer toutes les infos. Le 2e film, j'ai presque obtenu toutes les infos sauf les commentaires que j'ai dû aller chercher sur le site en accédant à l'onglet et le 3e film j'ai eu quelques infos et dû aller en chercher d'autres sur le site. Ce serait mieux si j'avais pas besoin d'aller chercher sur le site d'allocine avant.

Une idée pourquoi ça me fait ça?


P.S. Merci pour votre bon travail, je suis accroc à ce logiciel pour mes listes.



:grinking:
LeMoi
Posts: 171
Joined: 2006-04-09 11:26:43

Post by LeMoi »

Idem, erreur 403 depuis ce soir, j'ai les acteurs, les notes, la BA, mais pas les secrets de tournage...
Raoul_Volfoni
Posts: 863
Joined: 2006-08-31 23:58:18

Post by Raoul_Volfoni »

J'ai le même souci ... j'ai pas regardé, mais je sais pas trop d'où ça peut venir vu qu'on accède aux infos via navigateur, même en utilisant le user agent d'AMC. Là, je travaille sur le script CinEmotions et y a du boulot :/
antp
Site Admin
Posts: 9629
Joined: 2002-05-30 10:13:07
Location: Brussels
Contact:

Post by antp »

Peut-être qu'AMC récupère trop vite plusieurs pages ? On peut tenter de mettre une pause de deux ou trois secondes après chaque chargement de page via un Sleep(2000)
Raoul_Volfoni
Posts: 863
Joined: 2006-08-31 23:58:18

Post by Raoul_Volfoni »

Je viens d'essayer avec des pauses et ça change rien ... c'est juste plus lent.
Raoul_Volfoni
Posts: 863
Joined: 2006-08-31 23:58:18

Post by Raoul_Volfoni »

Voici le résultat de mes dernières investigations.

Le nombre d'erreurs 403 dépend des options que l'on utilise pour le script. En activant tous les éléments récupérables du script j'obtiens personnellement 5 erreurs 403. En exécutant le script à la main ligne par ligne j'ai pu identifié que hormis la page principale les appels vers les autres pages sont systématiquement refusés.

Pour ce film que j'utilise entre autres pour tester mes corrections, si j'ouvre dans un navigateur les pages qui posent problèmes à savoir le casting, les secrets de tournage, les photos et les ba ... le script récupère alors toutes les infos sans broncher comme déjà souligné ici par certains.
J'ai tenté un getpage2 avec plusieurs referer différents sans succès.

Je suis au point mort ... A noter que personnellement je récupère plus de choses qu'hier soir où les fiches étaient quasiment vides.
antp
Site Admin
Posts: 9629
Joined: 2002-05-30 10:13:07
Location: Brussels
Contact:

Post by antp »

Et si tu ouvres la page dans un navigateur sans cookies (càd dans une fenêtre de navigation privée, pas besoin de virer tous tes cookies pour tester :D), est-ce que ça marche aussi ?
Quoique si ça marche dans AMC après avoir été ouvert dans le navigateur, c'est plutôt côté serveur qu'il doit enregistrer un truc...
Raoul_Volfoni
Posts: 863
Joined: 2006-08-31 23:58:18

Post by Raoul_Volfoni »

ça marche aussi en fenêtre de navigation privée ... donc c'est pas une question de cookie ... le getpage3 ne nous sortira pas d'affaire :p
Raoul_Volfoni
Posts: 863
Joined: 2006-08-31 23:58:18

Post by Raoul_Volfoni »

Je crois que finalement le problème est lié au user agent d'AMC. Aujourd'hui n'ayant même plus accès à la page principale via AMC alors que c'était encore le cas il y a quelques jours. J'ai décidé de refaire des tests à partir d'un navigateur. Je ne sais pas pourquoi je n'obtenais pas les mêmes résultats il y a quelques jours, mais aujourd'hui lorsque j'utilise le user agent d'AMC dans mon navigateur je tombe sur une page "You have been blocked" de ce type. (cf capture ci dessous)

Image

Et sans rien faire d'autre que de remettre le user agent par défaut du navigateur et en rafraîchissant la page, je tombe sur la bonne page ... voilà voilà :/
Last edited by Raoul_Volfoni on 2016-11-30 17:42:58, edited 1 time in total.
antp
Site Admin
Posts: 9629
Joined: 2002-05-30 10:13:07
Location: Brussels
Contact:

Post by antp »

Hmm :/ embêtant
La solution d'ouvrir la page dans le navigateur avant importation AMC marche toujours ? Ou c'est aléatoire ?
Parce que si ça marche toujours il "suffit" que le script ouvre la page dans le navigateur avant de l'importer, attende deux ou trois secondes, puis fasse l'importation... (c'est un gros bricolage moche, mais bon...)
Raoul_Volfoni
Posts: 863
Joined: 2006-08-31 23:58:18

Post by Raoul_Volfoni »

antp wrote:La solution d'ouvrir la page dans le navigateur avant importation AMC marche toujours ? Ou c'est aléatoire ?
En ouvrant les 5 pages dont le script (full option) à besoin pour tout récupérer, oui ça marche toujours.
antp wrote:Parce que si ça marche toujours il "suffit" que le script ouvre la page dans le navigateur avant de l'importer, attende deux ou trois secondes, puis fasse l'importation... (c'est un gros bricolage moche, mais bon...)
En l'état actuel de mes connaissances, je sais pas faire ... Faudrait que je vois dans l'aide qu'elle est l'instruction pour ça, mais ça me parait lourdingue. Si on fait 4 recherches ça veut dire 20 pages à ouvrir. Surtout que je suppose qu'il n'y a pas d'instruction pour fermer les fenêtres ensuite ?

Après, à condition que l'on puisse s'en servir, il y aurait bien l'api ... mais bon ça veut dire tout réécrire :( ... et on récupérera certainement beaucoup moins de choses :/
antp
Site Admin
Posts: 9629
Joined: 2002-05-30 10:13:07
Location: Brussels
Contact:

Post by antp »

En effet, ça fait des fenêtres à fermer par l'utilisateur... mais c'est mieux que rien.
Y a une fonction Launch, de mémoire, pour ouvrir un truc externe (à vérifier dans la doc d'AMC)
En effet idéalement il faudrait utiliser l'API...
Raoul_Volfoni
Posts: 863
Joined: 2006-08-31 23:58:18

Mise à jour Allociné V2.26 au schnapps !!

Post by Raoul_Volfoni »

Bon :/ ... j'ai fais la modif dans cette version 2.26 ... c'était bien l'instruction Launch :) quelle mémoire !! :D (petite parenthèse sur le fichier d'aide, je sais pas si je l'ai déjà dit, mais le getpage3 n'est pas renseigné du tout dans l'aide de AMC (version 4.2.1 beta))

Perso, c'est inutilisable car AMC fonctionne sous Linux sur un vieux bouzin et l'ouverture des pages dans le navigateur ralenti énormément la machine en bouffant processing et mémoire à gogo, mais ça marchera peut être pour d'autres personnes.
J'ai implanté un paramètre pause dans 'les paramètres du script' sous les options du script à droite dans la fenêtre scripting. Ça permet de faire varier l'attente entre l'ouverture de la page par le navigateur et l'acquisition de celle ci par AMC. La valeur doit être en millisecondes et est de 3000 par défaut. Les personnes pour qui ça marchent peuvent essayer de réduire ce délai ou l'augmenter si ça marche pas. Je ne me rappelle plus quand 'Les paramètres' ont été implantés par Soulsnake, mais il doit falloir une version 4.2.0 d'AMC pour que ça marche.

Voilà c'est un peu à l'arrache ... si certains veulent tester ...

>>> Allocine V2.26 à tester <<<*
*A savoir que le script va ouvrir les pages dont il a besoin dans votre navigateur. Pour une récupération totale des données proposé par le script, cela peut ouvrir jusqu'à 7 pages dans votre navigateur qu'il faudra ensuite refermer à la main.
Dans tous les cas cette mise à jour n'en est pas vraiment une car le script dans l'état est peu exploitable ... il n'y a malheureusement pas grand chose à faire en l'état.
Last edited by Raoul_Volfoni on 2016-11-30 23:21:48, edited 3 times in total.
LeMoi
Posts: 171
Joined: 2006-04-09 11:26:43

Post by LeMoi »

J'avoue ne pas avoir tout compris, mais ce qui se passe chez moi est très bizarre...
Au moment ou AMC affiche la liste des résultats pour le script, ça m'ouvre la page web correspondante sur le site Allociné... Et quand je choisis le film ça m'ouvre 4 pages différentes (fiche, vidéos, anecdotes, casting) mais j'ai toujours l'erreur 403 et des infos manquantes sur la fiche :s enfin, surtout le lien de la BA et les secrets de tournage, le casting et le synopsis sont bien récupérés !
Raoul_Volfoni
Posts: 863
Joined: 2006-08-31 23:58:18

Post by Raoul_Volfoni »

LeMoi wrote:Au moment ou AMC affiche la liste des résultats pour le script, ça m'ouvre la page web correspondante sur le site Allociné... Et quand je choisis le film ça m'ouvre 4 pages différentes (fiche, vidéos, anecdotes, casting)
Oui c'est normal ... c'est voulu et le seul moyen actuellement pour pouvoir récupérer des infos avec le script. (sans avoir à ouvrir manuellement ces pages dans un navigateur)
J'ai pas réexpliqué ça dans la mise à jour parce qu'on en a discuté dans les messages précédents la mise à jour.
Si tu ne récupères pas tout c'est que l'affichage des pages dans ton navigateur et l'acquisition de ces pages dans AMC est trop courte ... relis mon message sur la mise à jour et ajuste la valeur de pause pour voir si ça change quelque chose ... dans ton cas augmente la valeur de pause à 4000, 5000 ou plus. Dans tous les cas cette mise à jour n'en est pas vraiment une car le script dans l'état est peu exploitable ... il n'y a malheureusement pas grand chose à faire en l'état.
LeMoi
Posts: 171
Joined: 2006-04-09 11:26:43

Post by LeMoi »

Je ne trouvais pas l'option, mais maintenant c'est bon, j'ai testé avec '5000' et ça a fonctionné :)
Un peu plus lent, ça ouvre pas mal de pages, mais bon, ça dépanne pour l'instant, merci ^^
xenesys
Posts: 154
Joined: 2008-10-10 09:40:03
Location: France (83/38)

Post by xenesys »

MAJ OK pour tempo à 4000.
C'est lourdingue leur changement quand même.....

je me suis alors posé la question : est ce que tout ce pataquès est mis en place pour éviter qu'ils ne se fassent siffoner leur site ? (en gros je siffone tout le site, j'elimine l'inutile et je recrée un nouveau site tout beau avec une base de donnée toute faite et je profite alors des pubs pour faire du fric)
Post Reply