|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
" I5 S/ S- j7 d/ c/ D7 t课程内容:8 j- X; y# u7 J( Z C6 R
课时1 爬虫实战_课程介绍2 Y! j7 n$ S4 Y$ R+ ^$ d+ I
课时2 爬虫实战_ 认识爬虫
" d- @( G; u6 z0 q; N. y 课时3 requests库的安装与基本使用2
5 u$ R( T' J2 O! C7 f+ I 课时4 requests库中的User-Agent请求头& {4 U M; l% x7 w+ \5 v
课时5 requests中的post请求4 O+ D, B$ f7 w! b
课时6 了解cookie和session
% r8 x1 B, Z4 \8 P! u! g1 v 课时7 requests中携带cookie信息
5 I; e6 @8 Y" d. X2 x5 |. \ 课时8 requests库中的session方法# \" {: R' j4 D7 e/ W
课时9 Xpath安装及基本操作
, \. ?3 Z5 p. K9 c# L# Q7 o 课时10 Xpath数据解析方法. V/ s3 V1 {: ] u5 U, p& W9 _
课时11 Xpath实战学习猿地登录2
/ u; N, s2 f, Q' Z/ k8 Z% l 课时12 爬虫实战Xpath抓取猿著文章3+ P' `- X6 g% N5 Z6 U+ t1 ]% F
课时13 bs4的安装与三种使用方式
+ X( y5 C1 D* m C9 s, ~ 课时14 bs4实战-学习猿地-猿圈
& @( \! {" O5 w8 [ 课时15 bs4-实战猿圈-代码优化
# i I$ K; ?7 f6 ~* S6 O- F3 ?- U. U. D 课时16 re正则模块-介绍2 v+ `) B& p, U9 h4 _' l+ X
课时17 re模块相关函数-match与search4 h3 w3 a* I5 d. Y9 y/ T+ ?# I# I$ A
课时18 re模块相关函数-其它函数% M* m. D9 A1 J6 X- f3 O: {
课时19 re模块-正则表达式的定义和规则-重点3$ t3 z) g$ `1 g: Y
课时20 re模块-正则实战-猿来如此/ d; `3 e/ w+ h& O3 i' a8 q
3 v2 H; w9 z& L z0 U( m
|
|