Fonction GetPage, script Allociné et résultat avec un moteur de recherche
Posted: 2024-01-09 20:35:02
Belle année 2024 !
J'essaie de faire fonctionner le script Allociné.
J'ai fait déjà plusieurs modifications pour que la fonction GetPage me charge la page de résultat d'un moteur de recherche sans erreurs. Mais je ne suis pas encore satisfait.
Ce qui ne marche plus car j'obtiens l'erreur "HTTP/1.1 400 Bad Request" :
- l'utilisation de google
Ce qui ne fonctionne pas :
- l'utilisation de Qwant, j'obtiens la même erreur qu'avec Google
- avec Duckduckgo, la page récupérée ne contient pas les résultats de la recherche, donc les URL vers les fiches Allociné
Ce qui fonctionne partiellement :
- l'utilisation de Brave Search, au bout d'un moment, il me bloque me prenant pour un bot. Je suis obligé d'attendre de nombreuses minutes avant de refaire une requête.
- l'utilisation de Bing, pour l'instant. Mais je trouve la page de résultat de recherche "trop chargée".
Ma préférence irait vers l'utilisation de Duckduckgo car la page de recherche est simple et semble complète mais le code source de la page de recherche ne correspond pas exactement au résultat affiché. Après plusieurs recherches sur ce problème, il semblerait que des éléments soient générés dynamiquement grâce au navigateur ce qui rend la récupération par GetPage incomplète.
En Delphi 7, j'ai vu qu'il était possible de simuler un navigateur avec un moteur de rendu Internet Explorer utilisé par TWebBrowser. Mais IE est sans doute déjà dépassé ou risque de l'être prochainement. Existe-t-il un autre moteur de rendu sous Delphi 7 ?
J'essaie de faire fonctionner le script Allociné.
J'ai fait déjà plusieurs modifications pour que la fonction GetPage me charge la page de résultat d'un moteur de recherche sans erreurs. Mais je ne suis pas encore satisfait.
Ce qui ne marche plus car j'obtiens l'erreur "HTTP/1.1 400 Bad Request" :
- l'utilisation de google
Ce qui ne fonctionne pas :
- l'utilisation de Qwant, j'obtiens la même erreur qu'avec Google
- avec Duckduckgo, la page récupérée ne contient pas les résultats de la recherche, donc les URL vers les fiches Allociné
Ce qui fonctionne partiellement :
- l'utilisation de Brave Search, au bout d'un moment, il me bloque me prenant pour un bot. Je suis obligé d'attendre de nombreuses minutes avant de refaire une requête.
- l'utilisation de Bing, pour l'instant. Mais je trouve la page de résultat de recherche "trop chargée".
Ma préférence irait vers l'utilisation de Duckduckgo car la page de recherche est simple et semble complète mais le code source de la page de recherche ne correspond pas exactement au résultat affiché. Après plusieurs recherches sur ce problème, il semblerait que des éléments soient générés dynamiquement grâce au navigateur ce qui rend la récupération par GetPage incomplète.
En Delphi 7, j'ai vu qu'il était possible de simuler un navigateur avec un moteur de rendu Internet Explorer utilisé par TWebBrowser. Mais IE est sans doute déjà dépassé ou risque de l'être prochainement. Existe-t-il un autre moteur de rendu sous Delphi 7 ?