|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
* j; o' n _5 q课程内容:: l% M0 t" @2 C9 C# B' s
课时1 爬虫实战_课程介绍
+ m4 b0 S2 s/ o# ~ 课时2 爬虫实战_ 认识爬虫# ~" o3 j" |! U& B
课时3 requests库的安装与基本使用2
5 R/ v) O0 y/ S4 x. s# V 课时4 requests库中的User-Agent请求头
1 b6 y0 M0 e9 o 课时5 requests中的post请求
1 M' O" C$ Y$ z0 c1 D 课时6 了解cookie和session/ {- {, z( r1 ]. ?, y
课时7 requests中携带cookie信息
& z* o- E7 ?. v0 @6 n) L 课时8 requests库中的session方法0 B9 W2 W7 \* x1 t) F& m
课时9 Xpath安装及基本操作
) O) }) h* w- F. ]0 i/ c! p 课时10 Xpath数据解析方法
* a4 }; t) p" J3 d. d/ X8 h3 { 课时11 Xpath实战学习猿地登录2# Q$ G+ x' D* L) D# {
课时12 爬虫实战Xpath抓取猿著文章3
, f* F& I& j. V$ u; ~. ? 课时13 bs4的安装与三种使用方式
! S7 W) {0 F* r' ]: D4 m8 o 课时14 bs4实战-学习猿地-猿圈. b! A6 ]0 V. q1 E5 n* s9 d
课时15 bs4-实战猿圈-代码优化" I. m4 V6 F- n$ \9 `5 h
课时16 re正则模块-介绍# W% X' c+ ^4 U6 M- f+ m
课时17 re模块相关函数-match与search- p* r" [: ~+ ?4 x0 D6 s) W3 ?
课时18 re模块相关函数-其它函数
5 q( E) y$ Y* B/ H 课时19 re模块-正则表达式的定义和规则-重点3$ i. q6 x* I9 V0 w2 D
课时20 re模块-正则实战-猿来如此/ ? i5 u V& N. e1 R( a2 [
# x* ~" o, b; Q+ ~- y- S: @+ h
|
|