crawler

command
v0.0.0-...-e43910c Latest Latest
Warning

This package is not in the latest version of its module.

Go to latest
Published: Apr 21, 2024 License: CC0-1.0 Imports: 6 Imported by: 0

README

Um Crawler simples

Nesse exemplo iremos aprender a usar um parser HTML, o GoQuery, para coletar as últimas notícias da UOL. Esse crawler é apenas um exemplo didático, não visa prejudicar o site da Uol.

Com o GoQuery, conseguimos buscar os elementos da página, buscando classes, ids etc, de forma "parecida" com jQuery.

Queremos pegar essas informações:

  • Data da publicação;
  • Descrição;
  • Fonte;
  • Imagem;
  • Título da notícia;
  • URL.

A primeira coisa que fazemos quando vamos capturar algum dado de uma página HTML é inspecionar a página e ver aonde estão as informações que queremos. Deixarei como exercício você fazer isso :D

Instale a lib que iremos usar:

go get github.com/PuerkitoBio/goquery

Mãos à obra!

Documentation

The Go Gopher

There is no documentation for this package.

Jump to

Keyboard shortcuts

? : This menu
/ : Search site
f or F : Jump to
y or Y : Canonical URL