Crawler do site Fundamentus.com com o uso do framework scrapy, tanto da aba detalhada como a de resumo.

Last update: Oct 04, 2022

Overview

Fundamentus com framework scrapy

Crawler do site Fundamentus.com com o uso do framework scrapy, tanto da aba detalhada como a de resumo.

Baixa informacões que os outros scrapys do fundamentus não realizam.

Para iniciar, dentro da pasta fundamentus digite: scrapy crawl detalhes -O nomedoarquivocriado.csv ou scrapy crawl resultado -O nomedoarquivocriado.csv

Não é um codigo elegante, mas funcional, realiza o scrapy de forma rapida.

As informacões baixadas são:

       columns = ['Papel', 'Cotação', 'Tipo', 'Data ult cot', 'Empresa', 'Min 52 sem',
                  'Setor', 'Max 52 sem', 'Subsetor', 'Vol $ méd (2m)', 'Valor de mercado',
                  'Últ balanço processado', 'Valor da firma', 'Nro. Ações',

                  'Dia', 'P/L',
                  'LPA', 'Mês', 'P/VP', 'VPA', '30 dias', 'P/EBIT', 'Marg. Bruta',
                  '12 meses', 'PSR', 'Marg. EBIT', '2021', 'P/Ativos', 'Marg. Líquida',
                  '2020', 'P/Cap. Giro', 'EBIT / Ativo', '2019', 'P/Ativ Circ Liq',
                  'ROIC', '2018', 'Div. Yield', 'ROE', '2017', 'EV / EBITDA',
                  'Liquidez Corr', '2016', 'EV / EBIT', 'Div Br/ Patrim', '2015',
                  'Cres. Rec (5a)', 'Giro Ativos',

                  'Ativo',
                  'Dív. Bruta',
                  'Disponibilidades',
                  'Dív. Líquida',
                  'Ativo Circulante',               
                  'Depósitos',
                  'Cart. de Crédito',
                  'Patrim. Líq',

                  'Receita Líquida_12meses',         
                  'Receita Líquida_3meses', 'EBIT_12meses', 'EBIT_3meses',
                  'Lucro Líquido_12meses', 'Lucro Líquido_3meses']
                  
                  e mais algumas informações...

Realizei este projeto com o fim de aprendizado e por não encontrar no github nenhum scrapy que pegue todas as informaçoes que eu precisava como setores e subsetores para realizar modelos KNN e KMC de machine learning.

Crawler do site Fundamentus.com com o uso do framework scrapy, tanto da aba detalhada como a de resumo.

Related tags

Overview

Fundamentus com framework scrapy

Owner

Guilherme Silva Uchoa

Docker containerized Python Flask API that uses selenium to scrape and interact with websites

Library to scrape and clean web pages to create massive datasets.

The core packages of security analyzer web crawler

VG-Scraper is a python program using the module called BeautifulSoup which allows anyone to scrape something off an website. This program lets you put in a number trough an input and a number is 1 news article.

A simple, configurable and expandable combined shop scraper to minimize the costs of ordering several items

Haphazard scripts for scraping bitcoin/bitcoin data from GitHub

A Pixiv web crawler module

Binance Smart Chain Contract Scraper + Contract Evaluator

A Python module to bypass Cloudflare's anti-bot page.

A simple flask application to scrape gogoanime website.

Google Developer Profile Badge Scraper

This program will help you to properly scrape all data from a specific website

Web crawling framework based on asyncio.

👨🏼‍⚖️ reddit bot that turns comment chains into ace attorney scenes

Web Scraping OLX with Python and Bsoup.

Creating Scrapy scrapers via the Django admin interface

News, full-text, and article metadata extraction in Python 3. Advanced docs:

Scraping weather data using Python to receive umbrella reminders

script to scrape direct download links (ddls) from google drive index.

一款利用Python来自动获取QQ音乐上某个歌手所有歌曲歌词的爬虫软件