|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
. ~6 C6 Q. n+ v+ q& T, A$ U课程内容:
( z6 n2 g; |( u8 o) O% f 课时1 爬虫实战_课程介绍
9 B* K$ [& n8 t" v 课时2 爬虫实战_ 认识爬虫
; O& @5 R7 l% A 课时3 requests库的安装与基本使用2
1 c2 v8 P; v7 `( e k 课时4 requests库中的User-Agent请求头 a. `5 ~2 R+ n' W$ Y" c
课时5 requests中的post请求6 D4 p7 S" }+ O# w( S
课时6 了解cookie和session, q7 B, M$ U% n
课时7 requests中携带cookie信息# P2 m) y1 t1 e3 d
课时8 requests库中的session方法
. L. P9 }1 Q' t% {: M 课时9 Xpath安装及基本操作
7 w: N8 }9 `7 w: K 课时10 Xpath数据解析方法. A, y, X, \+ L8 V
课时11 Xpath实战学习猿地登录2& X4 Y6 J2 N7 b7 @$ O
课时12 爬虫实战Xpath抓取猿著文章39 z+ o, y! f) V! D3 E
课时13 bs4的安装与三种使用方式
/ g- I1 O8 Z0 [6 S( F/ V 课时14 bs4实战-学习猿地-猿圈
2 W1 D7 g& O* R+ } 课时15 bs4-实战猿圈-代码优化
5 t5 z, G/ w. v0 w 课时16 re正则模块-介绍) d* D+ X6 l7 \( A7 W- h% n
课时17 re模块相关函数-match与search; v, d0 ^ ?; O" O9 b5 Y1 @2 O
课时18 re模块相关函数-其它函数
3 n; i: d& a9 G. D! t' O, t 课时19 re模块-正则表达式的定义和规则-重点3" `6 z8 L6 a8 r6 L, X& u. X
课时20 re模块-正则实战-猿来如此% R( X5 ?( l; i. s& \3 s- a& c, a
" U) l0 V! ^6 q* ?0 E; n" B5 y% A
|
|