• Categorias
    • Desenvolvimiento de software
    • Machine Learning & AI
    • Carreira de programador e dicas
    • Histórias de sucesso
  • Materiais Gratuitos
    • Calculadora CLT x PJ
    • Quiz de Front-end
    • Quiz de Mobile
    • Guia Full Stack atualizado
    • Guia de Negociação Salarial para Devs
    • Modelo de Currículo Internacional
  • Para Talentos
    • Criar perfil gratis
    • Ver vagas
  • Categorias
    • Desenvolvimiento de software
    • Machine Learning & AI
    • Carreira de programador e dicas
    • Histórias de sucesso
  • Materiais Gratuitos
    • Calculadora CLT x PJ
    • Quiz de Front-end
    • Quiz de Mobile
    • Guia Full Stack atualizado
    • Guia de Negociação Salarial para Devs
    • Modelo de Currículo Internacional
  • Para Talentos
    • Criar perfil gratis
    • Ver vagas

Início Como fazer web scraping python de maneira fácil e rápida

  • Foto de Geekhunter Geekhunter
  • outubro 25, 2024
web scraping python

Como fazer web scraping python de maneira fácil e rápida

O que é web scraping Python? Você vai conhecer as infinitas possibilidades que você consegue fazer com essa aplicação!

Com esse artigo você vai pode fazer um web scraper do zero e ainda sem complicação. 😉

10 Livros de Python para ser um especialista

O que é web scraping?

Web scraping é uma coleta de dados da web, de sites, onde são usados scripts e programas para “raspar” informações destes sites e que poderão ser usadas para futuras análises.

Por exemplo, comparar preços, monitorar o tempo, pesquisar o que está em alta no mercado, entre muitas outras coisas.

O tipo mais básico de web scraping é o download de alguma página web, que pode ser feito apenas apertando Ctrl+S ou Command+S em alguma página, assim ele faz a coleta dos dados da página e trata como um arquivo.

Não é a melhor forma de se fazer web scraping, por exemplo, pois você precisará entrar na página toda vez que quiser coletar as informações e isso demanda um pouco de tempo, não acha?

É aí que o web scraping Python entra, para automatizar esta tarefa!

Onde web scraping é usado?

O web scraping é usado em vários lugares e contextos, alguns deles estão na tarefa de algumas empresas.Como coletar preços e dados sobre o comércio eletrônico de uma concorrente para ajustar qual produto colocar em promoção e promover o marketing.

Os advogados também usam para ver relatórios e arquivos de julgamentos passados para estudar, visualizar ou até tratar esses dados da forma que eles precisarem.

Empresas de marketing também usam para coletar dados de perfis de pessoa para filtrar o público-alvo.

Empresas de mídia, como o Twitter, Facebook e Instagram, usam o web scraping Python para ver tópicos e os assuntos que estão em alta no momento.

Além de jornalistas que recolhem informações de alguma notícia, entrevista, relatório, reportagem.

O que é preciso para fazer um web scraping Python?

Para fazer um web scraping Python, obviamente vamos precisar do Python, mais especificamente a versão 3.

Iremos usar o pip para baixar as bibliotecas que iremos usar para fazer o web scraping Python, que serão elas: a Beautiful Soup, a biblioteca requests, e um editor de texto de sua preferência.

Python 3

Você pode encontrar o instalador do Python de acordo com o seu sistema operacional.

Pip

O pip vai servir para instalarmos as bibliotecas que iremos usar de uma forma fácil e rápida!

Requests

Para instalar a biblioteca que iremos usar para fazermos nossas requisições é a requests, você pode instalar-la facilmente com o pip com os seguintes comandos:

No Linux:

sudo pip install requests

No Windows:

Você tem que executar o cmd como administrador e usar o comando “pip install requests”.

Beautifulsoup

Por último, iremos instalar a biblioteca que iremos usar para fazer o web scraping Python, você pode instalar-la com o seguinte comando:

No Linux:

sudo pip install beautifulsoup 4

No Windows:

Execute o prompt de comando como administrador e instale-a com o comando pip install beautifulsoup 4 e, se tudo der certo, vai retornar algo parecido com a imagem a seguir:

O que você pode fazer com web scraping Python?

Você pode fazer muitas coisas com web scraping Python, neste artigo irei desenvolver um script bem simples que coleta dados e previsões do site do Climatempo como um exemplo prático.

Iremos tratar esses dados e ver qual a temperatura mínima e máxima de sua cidade, é bem simples e introdutório.

Ao longo do seu aprendizado, você pode adicionar mais e mais dados a este script para completar-lo. É interessante dispor de um tempo para o script ser executado periodicamente e também pegar dados todos os dias, por exemplo.

Depois de um mês executando diariamente, podemos tratar esses dados como: em qual semana choveu mais, em qual semana fez mais sol para depois fazer um gráfico.

Também é legal fazer um script com o web scraping Python que raspa o preço de produtos em promoção em um dia específico, ou até pegar preço de X produtos antes da Black Friday e ver os preços deles novamente para ver os descontos.

Você pode fazer isso e muito mais com o web scraping Python, é uma combinação poderosa com infinitas possibilidades.

Criando um web scraper do zero

Prontinho, já instalamos tudo o que iremos precisar e agora vamos criar um web scraper do zero usando o Python.

Primeiro, crie um arquivo com o nome que você preferir e com a extensão .py, abra-o com o seu editor de texto e cole o seguinte código:

from bs4 import BeautifulSoup

import requests

html = requests.get("https://www.climatempo.com.br/").content

soup = BeautifulSoup(html, 'html.parser')

print(soup.prettify())

Nestas linhas de código, estamos importanto as bibliotecas BeautifulSoup e requests nas duas primeiras linhas.

Na terceira estamos pegando todo o conteúdo de um requisição get na url do Clima tempo.

Na quarta e quinta linha é criado um objeto chamado soup que está interpretando o documento HTML.

Agora, execute-o no seu terminal ou prompt de comando com python nome-do-seu-arquivo.py e podemos ver que ele retornará todo o HTML da página.

Vai ser trabalhoso ler todo esse HTML até acharmos a informação que estamos procurando, nós vamos tratar e filtrar toda essa informação até o script retornar o que precisamos que, nesse caso, será a temperatura máxima e mínima.

temperatura = soup.find("span", class_="_block _margin-b-5 -gray")

print(temperatura.string)

Adicione estas duas últimas linhas ao final do arquivo e execute-o novamente.

Verá que vai retornar a temperatura máxima e mínima, o que está acontecendo neste código é que na primeira linha estamos procurando dentro do objeto do beautifulsoup definido mais acima, a temperatura mínima e máxima, “span “é a tag html, e “class_=” é a classe atribuída ao elemento.

Você pode ver a classe e o elemento apertando Ctrl+Shift+C ou Command+Shift+C em uma página HTML e selecionando com o mouse o elemento que quer raspar.

Em seguida, ele irá abrir ou na esquerda ou na direita um painel destacando o elemento selecionado, alguma coisa parecida com a imagem a seguir:

Após selecionar o texto que quer raspar basta achar o elemento pela identificação dele, seja id ou class, se for por id você pode encontrá-lo deste jeito: soup.find(id=”link3″), e na última linha de código estou mostrando na tela o texto cru deste elemento HTML, fácil né?

Conseguiu fazer o seu web scraper?

Se quiser se aventurar e fazer mais web scraping python, de uma olhada na documentação da biblioteca que usamos no artigo.

Qualquer dúvida, só comentar.

> Uma dica final para você: temos vagas de python sendo criadas todos os dias na plataforma da GeekHunter. Para demonstrar o interesse é bem fácil: crie um perfil grátis e seja aprovado em nossos testes.

Foto de Geekhunter

Geekhunter

Python IDE
10 melhores IDEs e editores de código em Python para 2025
  • março 18, 2025
o que é commit
O que é Commit e como usar Commits Semânticos
  • dezembro 13, 2024
certificações em TI
10 certificações em TI muito valorizadas hoje
  • novembro 20, 2024
Consultor SAP: o que faz, salário e como se tornar um
  • março 20, 2025
brainfuck
Brainfuck: A linguagem esotérica que desafia programadores até hoje
  • junho 27, 2025
gerente de tecnologia
As principais habilidades de um gerente de tecnologia
  • junho 27, 2025
vagas de TI
Vagas de TI: como encontrar uma que combine com você?
  • junho 26, 2025
Planejamento da equipe de metodologia scrum
Metodologia Scrum: o básico que todo DEV precisa saber
  • junho 24, 2025

Gosta do conteúdo? Assine nossa Newsletter!

Desenvolvimiento de software

Brainfuck: A linguagem esotérica que desafia programadores até hoje

  • Geekhunter
  • junho 27, 2025
Carreira de programador e dicas

As principais habilidades de um gerente de tecnologia

  • Geekhunter
  • junho 27, 2025
Desenvolvimiento de software

Vagas de TI: como encontrar uma que combine com você?

  • GeekHunter
  • junho 26, 2025
Desenvolvimiento de software

Metodologia Scrum: o básico que todo DEV precisa saber

  • Geekhunter
  • junho 24, 2025
Carreira de programador e dicas

Dicas de carreira: como criar seu perfil profissional com foco na área tech

  • GeekHunter
  • junho 24, 2025
AnteriorAnteriorEncapsulamento em Java: O que é e como aplicar no seu código
PróximoQualidade de software: Uma abordagem a testabilidadePróximo

Rod. José Carlos Daux – SC
401, 4120 – km 4, Bairro Saco
Grande – Florianópolis – SC
CEP 88032-005

Para Profissionais
  • Criar Perfil
  • Vagas de tecnologia
  • Blog TI
  • Criar Perfil
  • Vagas de tecnologia
  • Blog TI
Para Empresas
  • Plataforma de Recrutamento Tech
  • Serviço de Recrutamento Tech
  • Nossos Planos
  • GeekAcademy
  • Blog de RHTech
  • Perguntas Frequentes
  • Login Empresas
  • Plataforma de Recrutamento Tech
  • Serviço de Recrutamento Tech
  • Nossos Planos
  • GeekAcademy
  • Blog de RHTech
  • Perguntas Frequentes
  • Login Empresas
A Geekhunter
  • Sobre a GeekHunter
  • Suporte
  • Políticas de Privacidade
  • Termos de Uso
  • Portal LGPD
  • Sobre a GeekHunter
  • Suporte
  • Políticas de Privacidade
  • Termos de Uso
  • Portal LGPD

Add Your Heading Text Here