Récupérer du contenu sur Webarchive grâce à Zennoposter

Justin Pageaud - Zennoposter seo et webarchive

Qu’est ce que Zennoposter?

Zennoposter est un logiciel destiné à aider les débutants du codage à fabriquer des bots sans avoir recours à des connaissances en langage de programmation, ZennoPoster est essentiellement un outil qui peut être configuré en drag and drop pour effectuer diverses tâches sur le web et dans des dossiers. C’est un outil tout-en-un pour l’automatisation des tâches de référencement et vous pouvez automatiser n’importe quel travail que vous aviez l’habitude de faire manuellement sur un navigateur.

Il peut fonctionner comme un poster, un parseur, un enregistreur, un scrapper de moteur de recherche, un créateur de compte et bien plus encore.

ZennoPoster est une solution avancée pour les administrateurs de sites web et, si elle est correctement configurée, il peut par exemple s’inscrire automatiquement sur les profils des forums et des blogs, analyser les sites web et les moteurs de recherch. Le logiciel offre des fonctions puissantes qui vous permettent de tester la capacité de chargement de toute ressource en ligne et de vérifier sa protection contre les robots.

En tant que Référenceur seo sur Nantes  , cet outil permet donc d’automatiser un certain nombre de tâches SEO chronophages.

Voici le contenu Web archive qu’il est possible de récupérer grâce à Zennoposter

Si Google est le moteur de recherche ultime, Archive.org devrait être la deuxième référence d’information lorsque Google échoue. Pensons aux contenus qui, en raison de multiples circonstances, ont disparu dans le serveur source (obsolescence, changement d’adresse, plantage du serveur, censure, suppression accidentelle, etc.)

En surfant fréquemment sur le web, nous trouverons quelques URL inaccessibles, c’est là que Archive.org nous sera utile. Un exemple de cela est un lien brisé sur ce blog. Dans la section des publications, nous avons examiné une référence concernant un article en PDF d’une conférence universitaire. L’url (http://jornadagc.florida-uni.es/descargas/Comunicacion_de_crisis.pdf) est inactive dans le serveur source mais nous pouvons la récupérer à partir d’Archive.org en mettant l’url de référence inactive dans la boîte de recherche.

Le résultat est montré dans la capture d’écran ci-dessous, dans laquelle il précise l’emplacement du document et le décompte chronologique qui a été enregistré. Comme il s’agit d’un fichier PDF, nous pouvons le télécharger en cliquant directement sur la date de référence.

Cette méthode nous permet de récupérer des informations dans n’importe quel format non disponible sur le serveur d’origine ou sur le service de mise en cache de Google.

Que va faire Zennoposter ?

Le logiciel avec le programme qui nous intéresse ici permet de parcourir une liste de noms de domaines expirés récupérés pour l’exemple sur le site https://www.expireddomains.net/. L’outil récupère les éléments de la liste Csv puis les ajoute sur la recherche de la wayback Machine . Avec une pause pour chaque recherche, il peut ensuite récupérer le nombre de sauvegardes de chaque NDD expiré. En fonction de ce nombre de sauvegardes, il est ainsi possible de savoir quels sites ont eu par le passé du contenu que nous sommes susceptibles de récupérer.

Comment récuperer les sites avec beaucoup de contenu grâce à Zennoposter ?

1-Dans un premier temps, j’assigne la valeur 0 à ma variable index.

Ensuite, je mets le début de l’url qui m’intéresse dans une variable puis je récupère toutes les lignes de mon fichier excel de NDD expirés.

J’ajoute les Résultats dans une liste Zennoposter nommée Liste_site.

webarchive et zennoposter seo - Justin

2- Je mets en place mon if/else via la fonctionnalité Logic de Zennoposter

3-

Je vide la liste à remplir pour repartir de 0 à chaque nouveau tour de boucle.

Ensuite, je prends la ligne du tableau qui m’intéresse en fonction du numéro d’index auquel je suis pour remplir une variable avec ce contenu de la ligne.

Je réalise un merge de cette variable avec le domaine de la wayback pour utiliser la fonctionnalité « Go to page » sur cette nouvelle url.

Prendre une ligne de tableau avec Zennoposter - Justin Pageaud

4-J’ajoute ensuite une pause pour que le site ait le temps de charger le nombre de sauvegardes des sites explorés et j’utilise la fonctionnalité « Parse Data » pour récupérer le nombres de sauvegardes que j’enregistre dans une liste nommée « Sauvegardes » ». A la suite de cette opération, j’incrémente ma variable index de 1.

Récupération du nombre de sauvegardes avec Zennoposter - justin Pageaud

A la fin vous récupérez un fichier excel avec en colonne A le nom du domaine et en colonne B le nombre de sauvegardes.
Par exemple :
https://zennolab.com/ – 368 times.

Ainsi, vous savez si ce site a été mis à jour régulièrement et s’il est susceptible d’avoir eu du contenu par le passé.

Pour aller plus Loin dans cette automatisation Zennoposter.

Je vous invite à rechercher des sites dans des langues étrangères avec des tlds spécifiques comme par exemple .de ou .co.uk, ainsi, le pourcentage de contenu dupliqué se voit encore amoindri.

Ce contenu récupéré en langue étrangère peut ensuite être traduit grâce à l’outil bien connu deepl.

Récupérer du contenu sur Webarchive grâce à Zennoposter

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *