SERP Hacker support forum - serposcope

Support forum for open-source softwares built by serphacker.com : serposcope the rank checker.

You are not logged in.

#1 2018-10-25 13:01:03

Emb
Member
Registered: 2016-10-28
Posts: 7

Erreurs 403 et 302

Bonjour à tous,

Je suis en version 2.10.0 et bien que la plupart des recherches fonctionnent (merci encore pour la mise à jour !), j'ai environ 1 jour sur 2 où le scan apparaît en rouge à cause de quelques mots clés qui sont bloqués (d'une recherche à l'autre ce ne sont pas les mêmes mots-clés qui sont concernés).

Voici un extrait de log :

[2018-10-20 15:26:14,276] [google-1] INFO  c.s.s.s.g.s.GoogleScraper - GOT status=[200] exception=[none]
[2018-10-20 15:26:14,284] [google-1] TRACE c.s.s.s.g.s.GoogleScraper - sleeping 90964 milliseconds
[2018-10-20 15:27:08,847] [google-0] INFO  c.s.s.t.g.GoogleTaskRunnable - search "Infor M3 partner" | try 1 | total search done : 9/74
[2018-10-20 15:27:08,848] [google-0] DEBUG c.s.s.s.g.s.GoogleScraper - GET https://www.google.com/search?q=Infor+M3+partner&gl=us&uule=w+CAIQICIabmV3IHlvcmssIG55LHVuaXRlZCBzdGF0ZXM=&num=100 via proxy:bind://91.***.58.244/ try 1
[2018-10-20 15:27:09,365] [google-0] INFO  c.s.s.s.g.s.GoogleScraper - GOT status=[403] exception=[none]
[2018-10-20 15:27:10,366] [google-0] DEBUG c.s.s.s.g.s.GoogleScraper - GET https://www.google.com/search?q=Infor+M3+partner&gl=us&uule=w+CAIQICIabmV3IHlvcmssIG55LHVuaXRlZCBzdGF0ZXM=&num=100 via proxy:bind://91.***.58.244/ try 2
[2018-10-20 15:27:10,781] [google-0] INFO  c.s.s.s.g.s.GoogleScraper - GOT status=[403] exception=[none]
[2018-10-20 15:27:12,781] [google-0] DEBUG c.s.s.s.g.s.GoogleScraper - GET https://www.google.com/search?q=Infor+M3+partner&gl=us&uule=w+CAIQICIabmV3IHlvcmssIG55LHVuaXRlZCBzdGF0ZXM=&num=100 via proxy:bind://91.***.58.244/ try 3
[2018-10-20 15:27:13,117] [google-0] INFO  c.s.s.s.g.s.GoogleScraper - GOT status=[403] exception=[none]
[2018-10-20 15:27:16,118] [google-0] WARN  c.s.s.t.g.GoogleTaskRunnable - scrap failed for Infor M3 partner because of ERROR_NETWORK
[2018-10-20 15:27:16,118] [google-0] WARN  c.s.s.t.g.GoogleTaskRunnable - no more proxy, stopping the thread
[2018-10-20 15:27:16,118] [google-0] INFO  c.s.s.t.g.GoogleTaskRunnable - google thread stopped
...

Ici, malgré un captcha résolu quelques mots-clés plus tôt, Google bloque le proxy. Il continue donc ensuite avec les autres IP disponibles (j'en ai 3 au total), ce qui fait qu'il arrive régulièrement qu'un nombre importants de mots-clés ne sont pas vérifiés.


Parfois une erreur 302 (dans ce cas heureusement l'adresse IP continue à être utilisée) :

...
[2018-10-21 15:50:44,163] [google-0] INFO  c.s.s.s.g.s.GoogleScraper - GOT status=[200] exception=[none]
[2018-10-21 15:50:44,176] [google-0] TRACE c.s.s.s.g.s.GoogleScraper - sleeping 90537 milliseconds
[2018-10-21 15:51:26,690] [google-1] INFO  c.s.s.t.g.GoogleTaskRunnable - search "seminaire dombes" | try 1 | total search done : 59/74
[2018-10-21 15:51:26,690] [google-1] DEBUG c.s.s.s.g.s.GoogleScraper - GET https://www.google.com/search?q=seminaire+dombes&gl=fr&uule=w+CAIQICIrY2hhdGlsbG9uLXN1ci1jaGFsYXJvbm5lLHJob25lLWFscGVzLGZyYW5jZQ==&num=100 via proxy:bind://213.***.75.160/ try 1
[2018-10-21 15:51:27,293] [google-1] INFO  c.s.s.s.g.s.GoogleScraper - GOT status=[302] exception=[none]
[2018-10-21 15:51:27,472] [google-1] WARN  o.a.h.c.p.ResponseProcessCookies - Cookie rejected [CGIC="", version:0, domain:google.com, path:/complete/search, expiry:Mon Apr 22 06:46:03 CEST 2019] Illegal 'path' attribute "/complete/search". Path of origin: "/search"
...

Informations :
- Serposcope 2.10.0 / Java 1.8.0_111
- 3 proxy
- AntiCaptcha (pas d'autres services)
- 100 résultats / page
- Délai : entre 40 et 120 sec.
- Réessai sur erreur : 4


Qu'est-ce qui peut expliquer ce problème ? Est-ce que c'est normal parce que Google arrive de mieux en mieux à détecter ces recherches automatisées ? Est-ce que ma seule solution est d'acheter des IP supplémentaires ?

Merci beaucoup pour vos conseils ! :-)

Last edited by Emb (2018-10-25 13:02:13)

Offline

Board footer