|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。% G" q5 x7 {' h) R. }
课程内容:1 _; N+ w5 J7 w3 y
课时1 爬虫实战_课程介绍% B7 W7 }, W- J
课时2 爬虫实战_ 认识爬虫
+ u( P+ A; L l4 K" Q$ W& h, f: L# w* X 课时3 requests库的安装与基本使用2
) P) ? @ C( q0 v( w9 D 课时4 requests库中的User-Agent请求头
' c* f) o$ A% c( s5 T) g [$ k- N" i 课时5 requests中的post请求
6 j3 s% i, i( {4 \ 课时6 了解cookie和session
# j R$ w, x) w9 g& Q, w' u 课时7 requests中携带cookie信息
. R9 @4 K! Y" q, ^& x6 l 课时8 requests库中的session方法
6 V. X' m$ J( Q2 ~ 课时9 Xpath安装及基本操作
$ T' m/ e% @' q 课时10 Xpath数据解析方法
* Z5 a" r. w0 x9 u( F 课时11 Xpath实战学习猿地登录2# _) o7 w8 m3 @/ K9 V# G3 S' d
课时12 爬虫实战Xpath抓取猿著文章37 g" _. Z4 J6 a5 {3 o1 }. ?
课时13 bs4的安装与三种使用方式% S9 u! r9 |5 y4 u$ t- d3 A
课时14 bs4实战-学习猿地-猿圈1 |4 e& K$ z0 c* O2 { g
课时15 bs4-实战猿圈-代码优化( z5 U* c- L" ~% z
课时16 re正则模块-介绍" {) N. }3 m9 z
课时17 re模块相关函数-match与search
/ w* A& u/ k. c1 h% } 课时18 re模块相关函数-其它函数# H- L6 ?8 [; n" }; B, A1 r
课时19 re模块-正则表达式的定义和规则-重点3
8 W% E5 V# v3 b: D 课时20 re模块-正则实战-猿来如此7 [' M8 u1 ~2 W8 i/ i3 G
1 v* J, g3 t( L+ T% ^
|
|