|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。: b/ z1 j) g4 z. n/ N) w+ ]3 Z
课程内容:/ }$ L! ~* }! ?
课时1 爬虫实战_课程介绍
0 d7 W! |5 S' q C7 A2 x 课时2 爬虫实战_ 认识爬虫
$ r. v# M' s. _8 F# Z 课时3 requests库的安装与基本使用2$ g6 X! h8 C) \% A& l% G
课时4 requests库中的User-Agent请求头) _: A) ^+ i2 Q& [% U
课时5 requests中的post请求
0 m0 U8 V% s! q- Y, k 课时6 了解cookie和session* ]5 d0 U0 J( Q8 B g2 v
课时7 requests中携带cookie信息
, c$ R9 t9 p- `& ^1 I- q1 _ 课时8 requests库中的session方法
% Y1 v- w) t6 R/ E/ M3 A 课时9 Xpath安装及基本操作5 r; J* m7 T8 ?/ I B
课时10 Xpath数据解析方法: y0 ?4 S' G. s4 Q( Q9 V# g1 T
课时11 Xpath实战学习猿地登录2- X* B" w# h$ i$ L7 W9 p' v
课时12 爬虫实战Xpath抓取猿著文章3
, x1 M! ~; n+ z2 P9 a) g 课时13 bs4的安装与三种使用方式# M$ L: ^! {& J0 ]) J. W
课时14 bs4实战-学习猿地-猿圈
9 n. }2 U+ k' h. f- J 课时15 bs4-实战猿圈-代码优化+ k! A" y1 z, c0 j
课时16 re正则模块-介绍
" Z2 R1 w1 l' L" R" b 课时17 re模块相关函数-match与search. D1 I2 ? z7 M
课时18 re模块相关函数-其它函数. h7 M! w& c" M7 F0 `* t: G
课时19 re模块-正则表达式的定义和规则-重点3
- s' c/ C( `. q* {# p n0 p. u 课时20 re模块-正则实战-猿来如此
/ S! y! H+ R" D# u1 S9 s5 B0 a% U " n: h! o1 r" ?) V- L9 G8 K# \
|
|