|
|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
* |/ L' o2 M* x1 e课程目录:/ t$ _% P" q. p, l
1.1- 火车头采集器的安装和功能简介
( J. z% B0 @( S2 `( B8 p/ M9 S 1.2 - 火车头采集器的相关术语
% s Q- n3 C d5 c& ^$ }; Y& D 1.3 - 火车头采集器的学习建议
$ n) k' b' E n2 ?: y2 F 2.1 - 如何添加需要采集的单条网址& r o- h7 F% ~, J, o8 K
2.2 - 如何添加批量和多页网址
! w: D( N2 M$ y7 \" x+ b- L! i 2.3 - 如何导入txt网址到开始采集地址
9 c- d% ~! {! d' Z3 e 2.4 - 如何获取Rss地址中的网址作为起始网址) ^5 i7 b( n4 K3 ^6 z+ h
2.5 - 如何自定义一些网址的格式来采集新的数据
8 B" e6 K4 R/ D: w1 C 2.6 - 多级网址采集规则之从页面自动分析得到地址链接
4 [" B: j# C9 K% r 2.7- 多级网址采集规则之手动填写链接地址规则
; R t5 L4 _) N' i& V2 U' y7 B 2.8 - 多级网址采集规则之使用Xpath方式获取网址% a2 E1 E+ m# }: n
2.9 - 如何判断Http请求方式?是get还是post?+ f, R6 l r' V* ` T# x
2.10 - 多级网址采集规则之列表分页获取的方式
+ Q2 Z, t! } _# | Y! C 2.11 - 多级网址采集规则之附加参数是什么意思?% j, a* M3 C3 r
3.1 - 提取数据方式有哪些
4 b8 d5 D: _& n& y" e$ H- m6 ~ 3.2 - 数据处理之内容替换" o2 c: E1 @7 i! M2 O2 o2 n! Y* I
3.3 - 数据处理之Html标签过滤如何使用1 J' Z" m4 t- c/ u' g, _5 C* g
3.4 - 数据处理之字符截取. p7 _ H7 k2 m" D5 Y) X
3.5 - 数据处理之纯正则替换如何使用; X8 w7 _2 I8 z/ _& I
3.6 - 数据处理之数据转换7 M4 i9 U3 ?9 F4 c# f B" c
3.7 - 数据处理之自动摘要6 ]2 ]6 R4 |2 K
3.8 - 数据处理之自动分词
1 X; D' p: I* {; B: l+ Q+ i 3.9 - 数据处理之字符编码和解码
9 A" L: K Y, M% L$ G, b- o2 O4 Z 3.10 - 数据处理之同义词替换- b' `" P8 u* k& A9 j
3.11 - 数据处理之提取文章中的第一张图片9 I" ?2 h6 I3 C0 g: w
3.12 - 数据处理之空内容缺省值
, Y4 I2 s/ n' r 3.13 - 数据处理之内容前后缀
3 U, }* B: K- y3 f' G( R 3.14 - 数据处理之随机插入
, V" c2 p6 V2 I) K5 A4 Q/ l& F 3.15- 数据处理之OCR图片识别- v6 D; b+ M* U( X
3.16 - 数据处理之对单网址进行补全
$ O/ T$ u8 W4 y3 t2 F 3.17 - 数据处理之文件下载的设置方法8 a( \% D$ f q, V3 Z3 b8 r
3.18 - 数据处理之内容过滤相关设置
7 f2 p$ d, O" |* {6 o! i' G 3.19 - 自定义固定格式的数据
1 y' d" @; u2 s7 F" ^ 3.20- 如何循环采集一些数据
" ^# S8 x/ {4 p# d2 i2 {5 _ 3.21 - 如何采集网址中的数据
8 n$ }: w0 b4 S# Y# z 4.1 - Web在线发布到网址的设置方式; i6 R3 D; ]3 m2 B
4.2 - 将采集到的数据保存为本地TXT文件形式 P4 v, L, H- `5 p9 K% |/ D
4.3 - 将采集到的数据保存为本地Word文件形式
0 f1 v9 A- W3 P5 x) t 4.4 - 将采集到的数据保存为本地Excel文件形式
! l: N; y2 e" _1 \0 h7 O$ z+ f 4.5- 将采集到的数据保存为本地Html文件形式7 ?; m) v( F# R* [6 n7 v2 Z+ v1 z. y
4.6 - 将采集到的数据保存为本地Csv文件形式' p8 y. n B1 I: q! \5 H
4.7 - 将采集到的数据导入到自定义数据库$ z( L7 P* p6 H/ I
4.8 - 发布数据完成之后可以对数据进行哪些操作
% O. P9 O0 _; n/ G 4.9 - 如何控制每次发布的数据的条数
& |. X5 [( S0 M6 S# @- K 5.1 - 任务运行时线程设置的讲解
% A6 U9 x' g7 l7 r- v) Z 5.2 - 文件下载设置的相关注意事项
. } j4 G2 i, [; y6 A) S& Z2 | 5.3 - FTP同步文件上传如何设置# G" W9 f# z2 X, H& S
5.4 - 如何给采集到的图片加上水印7 a2 Z& w$ q4 X2 K3 X+ I
. u7 S/ K) W& [% [
|
|