|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。+ j1 I' d( I5 T/ \
课程内容:
) R! @+ y' i8 M' |' M; v4 ?# V 课时1 爬虫实战_课程介绍
3 B8 u& G* R" U n+ H" H 课时2 爬虫实战_ 认识爬虫
# Q4 V5 Q) b1 {' b4 \* A 课时3 requests库的安装与基本使用2
* ^4 |) @; B* e( i: A$ l9 p! D2 c: ^7 ` 课时4 requests库中的User-Agent请求头
0 Q3 M) B) N$ | 课时5 requests中的post请求/ v* W5 R: i/ k1 Z L
课时6 了解cookie和session* K+ f% B% J# B* ]. \. t
课时7 requests中携带cookie信息. O. n0 x, _( v8 W* ?5 |
课时8 requests库中的session方法
/ U2 P" J& H) k 课时9 Xpath安装及基本操作
! ^# N# G& [8 @7 Y6 r/ U 课时10 Xpath数据解析方法 d- x' }6 z. T% A( v! x9 d& c
课时11 Xpath实战学习猿地登录2
' l! Q0 `( |7 ?% t; [ 课时12 爬虫实战Xpath抓取猿著文章34 F) D. R( s) P) X
课时13 bs4的安装与三种使用方式& T3 ]! K7 H# k) ~5 i+ L1 W
课时14 bs4实战-学习猿地-猿圈& G9 K8 ^4 d% `9 x5 E
课时15 bs4-实战猿圈-代码优化9 F* M4 w: z6 O$ |: X9 a
课时16 re正则模块-介绍
% H% ]1 U! L7 Q 课时17 re模块相关函数-match与search
4 K$ ~7 c! f P6 _ 课时18 re模块相关函数-其它函数, A2 D' X; n$ I+ l- ~; w
课时19 re模块-正则表达式的定义和规则-重点3
0 k$ H" A! |6 `7 D9 a. R 课时20 re模块-正则实战-猿来如此) b' O$ b0 O0 |3 r6 S* l
3 n- ?! t: |8 \. y8 Z% q# p- D
|
|