|
|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
1 M4 O3 ]; s2 R课程目录:
6 x3 ]' r2 A* ^% s; {) N9 T 1.1- 火车头采集器的安装和功能简介! }% e" r& K* W2 z
1.2 - 火车头采集器的相关术语
& A E3 d8 L5 D: O 1.3 - 火车头采集器的学习建议3 j" A! `. w3 x* o. r$ J1 J8 U
2.1 - 如何添加需要采集的单条网址
2 l( M, W. F' w& G- p# J 2.2 - 如何添加批量和多页网址! e* I: E7 k) _2 f3 _+ w
2.3 - 如何导入txt网址到开始采集地址1 q2 {0 L/ e/ W# x6 V
2.4 - 如何获取Rss地址中的网址作为起始网址
$ E4 q& V7 m3 U 2.5 - 如何自定义一些网址的格式来采集新的数据# C. @& X) e X, i8 B- x* h, B
2.6 - 多级网址采集规则之从页面自动分析得到地址链接
, h) E& b% n' t4 v 2.7- 多级网址采集规则之手动填写链接地址规则$ r2 K+ P L. h5 P+ c: M% l7 [
2.8 - 多级网址采集规则之使用Xpath方式获取网址! ]) T' Z% p W- y
2.9 - 如何判断Http请求方式?是get还是post?
, d# p* }' B+ I" C0 t( P 2.10 - 多级网址采集规则之列表分页获取的方式; } Z+ i4 D* }1 q2 ]6 N ~
2.11 - 多级网址采集规则之附加参数是什么意思?, g- K' K0 _9 q( g
3.1 - 提取数据方式有哪些! w8 {; P& A0 H' i
3.2 - 数据处理之内容替换' Q, P F; A0 Z- y
3.3 - 数据处理之Html标签过滤如何使用
2 p0 o2 `& m5 A8 E( `; {2 Q 3.4 - 数据处理之字符截取
' p7 z9 L0 d8 X; c- a 3.5 - 数据处理之纯正则替换如何使用8 T8 M4 ^1 \' ]) {& M% j
3.6 - 数据处理之数据转换
) @& g% M: k% V7 j1 o* S 3.7 - 数据处理之自动摘要# M' S9 y- H: U2 `9 T, Z+ L
3.8 - 数据处理之自动分词
3 \: _. B: w8 Z, ], G3 Z0 } 3.9 - 数据处理之字符编码和解码
/ s: W4 m% u; G. { 3.10 - 数据处理之同义词替换
( s7 F5 ]* V6 J3 z- Z8 q 3.11 - 数据处理之提取文章中的第一张图片
8 x8 m7 Z$ s. Z" {4 j 3.12 - 数据处理之空内容缺省值
1 _& Q, Z5 i. |; Q% z7 ? 3.13 - 数据处理之内容前后缀! G4 O, P+ g) l& T0 J
3.14 - 数据处理之随机插入
& x: s* n' [" s& S& B( e 3.15- 数据处理之OCR图片识别
$ ]( Q* B3 q; k! d$ J$ Q8 b# X. L: E 3.16 - 数据处理之对单网址进行补全/ B( W. o, I( e2 q" [) n3 _; ~. s
3.17 - 数据处理之文件下载的设置方法
- _( u5 l/ x# M) k" ] 3.18 - 数据处理之内容过滤相关设置0 M) B0 I _: i
3.19 - 自定义固定格式的数据( U" N! n9 Z9 ^5 B5 d" g0 m. Y* r
3.20- 如何循环采集一些数据
1 o; f- C! G% R- ~/ n 3.21 - 如何采集网址中的数据1 C9 h$ G7 r' X0 w
4.1 - Web在线发布到网址的设置方式2 H* V0 S% N5 J
4.2 - 将采集到的数据保存为本地TXT文件形式% W: @6 s; C7 `$ x9 O9 ]" W/ n4 D
4.3 - 将采集到的数据保存为本地Word文件形式
4 K+ z6 K i& V+ |; U3 t0 c6 v: J 4.4 - 将采集到的数据保存为本地Excel文件形式
5 y5 T' H4 z: E9 R( X1 g 4.5- 将采集到的数据保存为本地Html文件形式
1 e7 \6 T: c1 E6 P( v& F% _ 4.6 - 将采集到的数据保存为本地Csv文件形式
$ M' T1 g, _; G$ E* T9 Z4 P 4.7 - 将采集到的数据导入到自定义数据库- k c& B2 y" M) u2 ^
4.8 - 发布数据完成之后可以对数据进行哪些操作6 I: q' B4 ?) f- P& B
4.9 - 如何控制每次发布的数据的条数
( y+ i2 N. q' {) S, k3 P 5.1 - 任务运行时线程设置的讲解9 i8 M- S. x# n* ?; I# c) c
5.2 - 文件下载设置的相关注意事项5 b `( ]8 f# U. d: q; |# H
5.3 - FTP同步文件上传如何设置# i& R5 [0 F( \# f4 {5 P1 V
5.4 - 如何给采集到的图片加上水印+ V5 ^% V4 J4 Z3 Q. C5 c; ?
* y, I* ?* h# n
|
|