This project is a Web Scraper built using Node.js to extract company information from the Racius website. It uses ScraperAPI to bypass blocks and automatically rotate IPs, ensuring efficient scraping even for large datasets.
- Scraping multiple pages automatically through pagination.
- Extracts detailed company information, such as:
- Address
- Legal Form
- Share Capital
- Activity
- About the Company
- CAE (Economic Activity Code)
- Utilizes ScraperAPI to avoid being blocked.
git clone https://github.com/RodrigoCarrico01/scraper_pagination.git
cd scraper_pagination
npm install
SCRAPER_API_KEY=YOUR_SCRAPERAPI_KEY
node app.js
Visit your dashboard for more details:
https://dashboard.scraperapi.com
Este projeto é um Web Scraper desenvolvido em Node.js para extrair informações de empresas do site Racius. Utiliza a ScraperAPI para evitar bloqueios e fazer rotação automática de IPs, garantindo um scraping eficiente mesmo em grandes volumes de dados.
- Scraping de várias páginas com paginação automática.
- Extração de informações detalhadas das empresas, como:
- Morada
- Forma Jurídica
- Capital Social
- Atividade
- Acerca da Empresa
- CAE
- Uso da ScraperAPI para evitar bloqueios.
git clone https://github.com/RodrigoCarrico01/scraper_pagination.git
cd scraper_pagination
npm install
SCRAPER_API_KEY=YOUR_SCRAPERAPI_KEY
node app.js