Jump to content

Enregistrer une page web en pdf (Scrapping)


Recommended Posts

onjours je suis bloqué sur un script qui me permettrait d'enregistrer plusieurs page web en pdf.
Pour cela j'utilise la librairie node Puppeteer

J'ai réussi à faire tourner la fonction pour une page, mais lorsque je rajoute une boucle, il me sauvegarde uniquement la dernière page web de ma liste (cf la dernière région dans l'exemple)

Je comprends pas ... Est ce que vous pouvez m'aider svp ? :)
Je précise que je suis novice en JS

Merci !

const puppeteer = require('puppeteer');

var liste = ["Grand_Est","Région_Bretagne","Occitanie_(région_administrative)"];
var i = 0;
var debut ="https://fr.wikipedia.org/wiki/";
var lien ="nul";
var region ="nul";


async function getPic() {
  const browser = await puppeteer.launch(); 
  const page = await browser.newPage();
  await page.goto(lien);
  await page.waitFor("body");
  await page.emulateMediaType('screen');
  await page.pdf({path: region+'.pdf'});
  await browser.close();
}


for (i = 0; i < 3; i++) {
region= liste[i];
lien = debut + region;
getPic();
}

 

Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
×
×
  • Create New...