|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
3 a N Q/ E+ @+ \4 i课程内容:
! Z) H B7 f0 B5 ]7 |, Q& ` 课时1 爬虫实战_课程介绍
2 x$ }$ |# k0 |* H& k0 \ 课时2 爬虫实战_ 认识爬虫
$ m0 w$ K+ w+ h' _" V 课时3 requests库的安装与基本使用2
; v1 c8 ]& _: v- ~ 课时4 requests库中的User-Agent请求头% R2 K) _# J* h; Q/ o! `* A9 H
课时5 requests中的post请求- m$ K( i3 N, E' O; H- a! M3 e. W" F
课时6 了解cookie和session3 l+ M' V& M" i! y
课时7 requests中携带cookie信息
8 o- u1 z$ }1 s 课时8 requests库中的session方法, i7 \5 B7 z2 H) |- T
课时9 Xpath安装及基本操作
' l) B' e1 ~4 b) D 课时10 Xpath数据解析方法# x' C2 n5 e; d
课时11 Xpath实战学习猿地登录27 N5 u( z7 g. A; m
课时12 爬虫实战Xpath抓取猿著文章3
9 v. `# i2 L- @ 课时13 bs4的安装与三种使用方式8 y6 G" `" i( a! p
课时14 bs4实战-学习猿地-猿圈( W7 v8 P7 {8 o+ H o+ W" D2 H
课时15 bs4-实战猿圈-代码优化
' x+ ]! _! ^# U, G 课时16 re正则模块-介绍
7 }3 L* m7 e* Y1 ?( N! k 课时17 re模块相关函数-match与search, C3 q. S) c6 [* y, \
课时18 re模块相关函数-其它函数
# Q# M; t. e- J3 s& L" R7 v/ A 课时19 re模块-正则表达式的定义和规则-重点3
6 G/ A+ P* P; H+ ^2 ~ 课时20 re模块-正则实战-猿来如此% v& V% c$ f" O8 y% o6 _
, i0 Y# D4 ~/ g5 p9 o1 w( \
|
|