|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
9 v6 G, N* d# V4 d5 R) G, z课程内容:
/ u* D& g; q, a2 d4 N4 S8 C 课时1 爬虫实战_课程介绍
( p/ i8 A) F4 Z 课时2 爬虫实战_ 认识爬虫
q; B1 e3 L9 @; A7 ?* ~9 w 课时3 requests库的安装与基本使用27 l# z' i5 e! @5 L. g1 r" b1 J
课时4 requests库中的User-Agent请求头4 U! @% f# f3 H% ?* ~, ?7 p
课时5 requests中的post请求
* \4 q, Q: g. T8 d9 L/ l 课时6 了解cookie和session
/ n n- { }! q, {+ g* @! M' F 课时7 requests中携带cookie信息
% r( U1 X, w: [7 S 课时8 requests库中的session方法
u: y. |: j4 `4 b: M- V( Z% h% J 课时9 Xpath安装及基本操作1 l) h E- S( I2 ?# J5 ?, ~1 {6 E! z
课时10 Xpath数据解析方法
. | P; v: ?2 I1 j' ?4 l 课时11 Xpath实战学习猿地登录2
6 ?! {. x% A; S/ L+ ?, y9 u 课时12 爬虫实战Xpath抓取猿著文章3
! c) Z3 d9 n: X% D; W2 G' k 课时13 bs4的安装与三种使用方式. |# H$ ]! A% b4 W3 j
课时14 bs4实战-学习猿地-猿圈
, ]$ ^/ l$ P1 t" Y y2 _2 I- K 课时15 bs4-实战猿圈-代码优化9 z2 o8 a8 f( @. e8 X- J# y$ A. r
课时16 re正则模块-介绍
3 C. U( g, k! ?& |# \. i, m( S8 a$ @! ?( Z 课时17 re模块相关函数-match与search
3 y. r# G8 W' p1 M! r4 Q$ v 课时18 re模块相关函数-其它函数" D; s3 [9 |3 E0 \
课时19 re模块-正则表达式的定义和规则-重点3! b) @8 t6 D) K! z+ _/ r
课时20 re模块-正则实战-猿来如此
5 ?5 P/ i; r: m: f3 ~ * L: s5 b% n( d) s
|
|