|
|
了解基本前端技术HTML、CSS、JavaScript,了解Linux、MySQL,Redis。课程主要学习Python网络编程详解、、Python网络爬虫的环境集成、Python网络爬虫的工作原理剖析、自动化爬中技术、异步网络爬虫框架Scrapy、数据爬取项目实战、分布式多线程爬虫实战、 反扒机制攻略。1 u z% i1 a1 V- v* R7 } k
课程内容:
, o. ?, G/ r& _' Z. \ ~* p/ D 课时1 爬虫实战_课程介绍
; N, N8 M7 s. G d# H 课时2 爬虫实战_ 认识爬虫. s: _5 P* V2 F. U
课时3 requests库的安装与基本使用2
3 `: ~) b8 Z4 ^9 I# t6 g 课时4 requests库中的User-Agent请求头1 j O6 z# F- |
课时5 requests中的post请求& J" h' a. w1 a
课时6 了解cookie和session4 ]& X) [- y( I' [
课时7 requests中携带cookie信息8 y' c* ?8 i1 o& |2 L% B$ i
课时8 requests库中的session方法
8 z# v7 l7 G' i. {% v 课时9 Xpath安装及基本操作
7 ?) l8 J5 P3 C0 Q% v 课时10 Xpath数据解析方法
5 Y( s, s0 t0 G1 Z7 h 课时11 Xpath实战学习猿地登录2' K" @! [4 U) n/ u
课时12 爬虫实战Xpath抓取猿著文章3
% U' T* {9 l, _$ v 课时13 bs4的安装与三种使用方式
1 K+ W& ?% n1 k 课时14 bs4实战-学习猿地-猿圈
5 A/ ~( ?: N# I8 d; {, z& f 课时15 bs4-实战猿圈-代码优化
; ~8 d. J. I3 ?' Y! ~9 ~ 课时16 re正则模块-介绍: M% [/ q, E7 N. \, a& N# Z9 i
课时17 re模块相关函数-match与search
5 I9 ~5 V% w# Z7 c6 G* \" M 课时18 re模块相关函数-其它函数
0 f3 l9 F+ M2 c 课时19 re模块-正则表达式的定义和规则-重点35 {1 q) o7 G% q7 G! E/ F
课时20 re模块-正则实战-猿来如此
1 _. v2 C. t7 P# U6 f
( U& O; V; k* d! y. ]+ |
|
|