crawler

command
v0.0.0-...-0216257 Latest Latest
Warning

This package is not in the latest version of its module.

Go to latest
Published: Jun 3, 2020 License: Apache-2.0 Imports: 14 Imported by: 0

README

请求处理模型=请求URL + URL对应的Parse

0: 先向引擎发起一个种子请求处理模型(URL+Parse) 1: 引擎将请求放入任务队列中 2: 引擎从任务队列中取出请求处理模型(如果还有请求的话) 3. 将请求的URL发送给下载器 4. 下载器根据URL返回对应的html内容(utf-8编码的文本)给引擎 5. 引擎将html内容转发给请求处理模型对应的解析器(Parse) 6. 解析器返回处理后的得到的新的请求处理模型及Item信息(URL+Parse,Item) 7. 重复1-6

Documentation

The Go Gopher

There is no documentation for this package.

Directories

Path Synopsis

Jump to

Keyboard shortcuts

? : This menu
/ : Search site
f or F : Jump to
y or Y : Canonical URL