|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。
4 n3 |1 ^9 [% V$ \; t5 Z课程内容:, ~3 r1 O7 N3 e2 S" ?/ \& W. T1 d
课时1 爬虫实战_课程介绍9 ?% V2 h+ I( R, [" a2 A
课时2 爬虫实战_ 认识爬虫* l5 d* [7 {1 X3 Y2 k- n
课时3 requests库的安装与基本使用2+ O" q% J/ V. s, I9 T; ~) }
课时4 requests库中的User-Agent请求头
/ \+ o3 b7 Q; z# ] 课时5 requests中的post请求; u2 P/ p( K" \/ @3 c0 x
课时6 了解cookie和session
/ g/ ]+ Z2 t7 S5 s 课时7 requests中携带cookie信息" k: w4 M7 ~& b3 G
课时8 requests库中的session方法
# S8 T: p5 p, t0 ?5 |7 N 课时9 Xpath安装及基本操作% Z5 v; s! H6 j# ]
课时10 Xpath数据解析方法
8 [- n/ D1 }1 W$ L) H5 r 课时11 Xpath实战学习猿地登录27 Y3 B2 |0 b$ _& T
课时12 爬虫实战Xpath抓取猿著文章3
1 N' ]4 D- T V6 i5 C5 h 课时13 bs4的安装与三种使用方式: k" b1 K, ^& s9 ?; O" ^" h
课时14 bs4实战-学习猿地-猿圈) H" G) H9 C! ]
课时15 bs4-实战猿圈-代码优化
# B% x/ ~; |7 e9 e! ?' C 课时16 re正则模块-介绍
N( E9 A" N3 y4 y$ {- T4 F 课时17 re模块相关函数-match与search
( w2 w/ R1 W! F1 H q* M/ J8 W: ~ 课时18 re模块相关函数-其它函数- F! W1 d4 c* |) X
课时19 re模块-正则表达式的定义和规则-重点3! h2 H7 R) p* g/ e
课时20 re模块-正则实战-猿来如此. U) ?" O6 f! i; |! V
4 K0 Z9 W9 j. L* Z) e
|
|