|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。2 \$ T2 g! z/ `' V8 P3 Y# K" D- x
课程目录:7 r* S" H. q4 v+ k$ G$ z! u7 E
1.1- 火车头采集器的安装和功能简介* Y/ [5 E& D; i4 h/ c' \8 r% D
1.2 - 火车头采集器的相关术语. i5 ]3 T5 O0 |& T! S/ `* x
1.3 - 火车头采集器的学习建议. W. W$ U2 P& Z6 R7 h& d+ o
2.1 - 如何添加需要采集的单条网址, \% e* n6 C2 R. b9 @( L6 r
2.2 - 如何添加批量和多页网址/ x0 p! j- C9 Z. T m5 \
2.3 - 如何导入txt网址到开始采集地址0 W5 h! |# i0 P a8 B- H; V
2.4 - 如何获取Rss地址中的网址作为起始网址7 {" {+ K6 W; x& o
2.5 - 如何自定义一些网址的格式来采集新的数据
; S( w1 V2 P9 s" T+ k# u 2.6 - 多级网址采集规则之从页面自动分析得到地址链接
1 L$ p0 G# n, r 2.7- 多级网址采集规则之手动填写链接地址规则" k e- u1 q# X: K; f. N- W- D
2.8 - 多级网址采集规则之使用Xpath方式获取网址
b5 f. n& h r 2.9 - 如何判断Http请求方式?是get还是post?" p. D' @/ R" F2 c0 G( C( M. E' S7 X
2.10 - 多级网址采集规则之列表分页获取的方式
$ ?; H0 P+ D, K 2.11 - 多级网址采集规则之附加参数是什么意思?
* ^! a( f% T+ t% M& @& S 3.1 - 提取数据方式有哪些
7 Z C4 \3 K4 ` |; U3 Z 3.2 - 数据处理之内容替换
; a8 I1 B P8 K$ V0 |4 L 3.3 - 数据处理之Html标签过滤如何使用
) q7 [3 h8 t3 b* m 3.4 - 数据处理之字符截取& _" `# O& \3 G D( }/ r+ ^
3.5 - 数据处理之纯正则替换如何使用8 u4 Q, X& z$ A3 \
3.6 - 数据处理之数据转换, P" y1 Z+ R$ U- b: B
3.7 - 数据处理之自动摘要
& U: a* z, I% T9 V6 C% G: `; B 3.8 - 数据处理之自动分词+ j$ z8 F" Y* u; O
3.9 - 数据处理之字符编码和解码
9 z9 l* f# [' y8 v1 \ 3.10 - 数据处理之同义词替换( _7 y: }% k3 |
3.11 - 数据处理之提取文章中的第一张图片/ O1 c% I* G# l2 W2 d4 R
3.12 - 数据处理之空内容缺省值; _& s: V! H1 U* P+ N8 U% }6 [
3.13 - 数据处理之内容前后缀. F4 Y0 O- P, F* _8 G2 ~$ P4 z
3.14 - 数据处理之随机插入, R; `$ C- N% b& F' n+ y# f V0 Q o
3.15- 数据处理之OCR图片识别
4 Y" C$ X, K3 K. o) ~$ C: S1 ? 3.16 - 数据处理之对单网址进行补全
3 \) f: H9 L+ h" H 3.17 - 数据处理之文件下载的设置方法
9 j9 A. X& I" n0 @% L2 Q 3.18 - 数据处理之内容过滤相关设置
+ s5 t+ c6 @) D$ u 3.19 - 自定义固定格式的数据0 P# g9 o* P& F4 O: x; O, D" F9 C
3.20- 如何循环采集一些数据 ]+ U0 L' {& R2 I. k. x) h2 Z$ @1 c
3.21 - 如何采集网址中的数据* ~$ a- ^: I9 c7 R2 f& f
4.1 - Web在线发布到网址的设置方式
+ d# x" X0 \" }+ c: h9 X: t 4.2 - 将采集到的数据保存为本地TXT文件形式
: J- Z8 L9 s; Z 4.3 - 将采集到的数据保存为本地Word文件形式) @2 I' M$ R# z F9 u: T
4.4 - 将采集到的数据保存为本地Excel文件形式9 A0 L# ]0 e2 n
4.5- 将采集到的数据保存为本地Html文件形式/ Q$ q6 l6 b5 o' k; F
4.6 - 将采集到的数据保存为本地Csv文件形式
2 E2 p8 }: Y1 Y 4.7 - 将采集到的数据导入到自定义数据库
8 n$ N3 h9 }- a, j1 p8 y J7 m( A 4.8 - 发布数据完成之后可以对数据进行哪些操作
* E: d# Y5 o5 p) c3 K6 g- `7 h* _8 Z 4.9 - 如何控制每次发布的数据的条数 L1 e( P* r8 Y3 }$ V9 e
5.1 - 任务运行时线程设置的讲解
5 X5 Z0 t4 p* s 5.2 - 文件下载设置的相关注意事项9 R0 ], f5 c' T
5.3 - FTP同步文件上传如何设置
/ f5 ^8 Y3 g) M- O& h3 Z9 ~ 5.4 - 如何给采集到的图片加上水印
! B* [. c- A, E+ }- S$ j2 e5 r3 H 8 X6 D5 S. ]) b9 x
|
|