|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
) z% G) G7 H) [* K: b" Q课程内容:
" A$ E9 d& A: @1 z 课时1 爬虫实战_课程介绍
+ N3 N3 \5 c4 m9 s+ u- g- h 课时2 爬虫实战_ 认识爬虫
% z3 L5 X% s% g8 u0 j3 N9 W 课时3 requests库的安装与基本使用2
, [' U2 g- h' O" ~* J* Q 课时4 requests库中的User-Agent请求头" @* E3 P: S' ^
课时5 requests中的post请求
+ L7 L z9 F/ a 课时6 了解cookie和session8 ?$ M+ G8 s2 i2 Z1 _* u
课时7 requests中携带cookie信息
! z5 |: H$ {6 w 课时8 requests库中的session方法; u" O) c% u; u+ t% n. O6 m
课时9 Xpath安装及基本操作- G( j; H- H/ U
课时10 Xpath数据解析方法
) j/ w% K/ q5 Z' c, K" n 课时11 Xpath实战学习猿地登录2# L0 @5 m2 I% D8 m- \# G* K
课时12 爬虫实战Xpath抓取猿著文章3# |6 F/ n" K% F, z# [# |) S
课时13 bs4的安装与三种使用方式/ V e! \5 ~% P' e1 F
课时14 bs4实战-学习猿地-猿圈
; t/ I* p& C5 R5 {- T 课时15 bs4-实战猿圈-代码优化
& T9 z9 u8 d/ N1 {' J 课时16 re正则模块-介绍
4 o+ g) O' W6 D" @% n. h6 S/ x 课时17 re模块相关函数-match与search
& j3 m/ o. y4 e d" M: S 课时18 re模块相关函数-其它函数, a$ U) A; g7 [# F& u- f
课时19 re模块-正则表达式的定义和规则-重点3
# v9 p! \9 h+ C: V 课时20 re模块-正则实战-猿来如此
, D6 l; `) L" k- L z, y% ~ 8 ~6 a; J; g, a# L) U4 _
|
|