|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。/ d4 ~7 K) M; X: Z
课程内容:
: }1 q) L1 [2 F' C. a% o" T 课时1 爬虫实战_课程介绍/ N* {5 A* T; z. D# D1 Q4 `& T% _
课时2 爬虫实战_ 认识爬虫
2 W9 ^& n4 ~* y1 }! {+ n4 k6 _ 课时3 requests库的安装与基本使用2* D& y8 b% d0 M3 o% S! j. a x! x
课时4 requests库中的User-Agent请求头
$ G) @, i2 y5 g8 k2 n& E 课时5 requests中的post请求
, E+ P: o" k- H$ R4 ` 课时6 了解cookie和session) e5 n/ q5 R/ l' W& t3 Y
课时7 requests中携带cookie信息# { l' }6 D; Z5 t/ S, a: A
课时8 requests库中的session方法
! c4 N& Q% f, Z9 J 课时9 Xpath安装及基本操作# F, E5 b& h* Q5 o) L, o
课时10 Xpath数据解析方法
: ]( y E3 Q( ?; B% l 课时11 Xpath实战学习猿地登录2
& k# u( B" X. ~4 T0 l0 R4 v 课时12 爬虫实战Xpath抓取猿著文章3
+ N& C1 f; _' h: v% @9 Q 课时13 bs4的安装与三种使用方式
+ _6 s1 B) ~# @& ~5 ` 课时14 bs4实战-学习猿地-猿圈
, Y2 M/ x u9 h! _ 课时15 bs4-实战猿圈-代码优化" g# t' q. q7 g. B
课时16 re正则模块-介绍/ h: j7 w9 ~ G
课时17 re模块相关函数-match与search7 R% h' n ?3 ^' ~/ W
课时18 re模块相关函数-其它函数+ _/ y( D3 G0 V6 T* _8 I- B
课时19 re模块-正则表达式的定义和规则-重点30 K9 X7 l( C' f/ M4 y& o9 q: j. X* L
课时20 re模块-正则实战-猿来如此% b; [, R4 a5 |/ N+ b# j1 O
( N6 l1 E0 ~3 a
|
|