|
|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
& q5 G* k3 Q5 H( \; X! C6 \课程目录:5 `. U& W6 g' Q
1.1- 火车头采集器的安装和功能简介' R' Q( x/ l7 Z: }: b
1.2 - 火车头采集器的相关术语
. F7 A1 M# I$ B+ M$ h; L+ h- | 1.3 - 火车头采集器的学习建议
2 |. q8 C0 \ B6 G 2.1 - 如何添加需要采集的单条网址* \. P0 D' V' Y% \" ]
2.2 - 如何添加批量和多页网址% G( U2 U& l; z$ n
2.3 - 如何导入txt网址到开始采集地址2 G) Q1 N; A7 `3 B1 \7 _$ z; d
2.4 - 如何获取Rss地址中的网址作为起始网址
8 ~1 }5 u( n4 ~. j* y0 t8 g 2.5 - 如何自定义一些网址的格式来采集新的数据# n" B# h6 u) l
2.6 - 多级网址采集规则之从页面自动分析得到地址链接3 f" O/ k: a% X3 V, A- f3 N) \
2.7- 多级网址采集规则之手动填写链接地址规则
6 x5 U7 n# V' Y2 D: o 2.8 - 多级网址采集规则之使用Xpath方式获取网址# [& U2 E! F7 y( o& k2 w6 n
2.9 - 如何判断Http请求方式?是get还是post?) |) x6 U( Y$ h" h6 H! z8 T3 F0 } N
2.10 - 多级网址采集规则之列表分页获取的方式
$ t/ j' q; O3 E& c1 ^2 A 2.11 - 多级网址采集规则之附加参数是什么意思?% U* `2 z0 a8 t( x
3.1 - 提取数据方式有哪些' y& c' v% z& g; y5 m; ^2 T7 D1 N
3.2 - 数据处理之内容替换
+ _6 I2 j; z- A P S- G4 P' w1 i 3.3 - 数据处理之Html标签过滤如何使用; J. O: T( o# o; n r B. F
3.4 - 数据处理之字符截取9 B$ y$ S+ U) U& D6 V c, ~% R
3.5 - 数据处理之纯正则替换如何使用
! h* d5 x6 W% u6 ?5 R/ J3 u 3.6 - 数据处理之数据转换
5 A9 d4 v" T: K3 J: k 3.7 - 数据处理之自动摘要
, |4 l& W+ |5 g8 P4 q w) N 3.8 - 数据处理之自动分词
6 g: W, s1 {7 [8 l 3.9 - 数据处理之字符编码和解码4 w1 u4 k, o) X% v/ i0 I/ V
3.10 - 数据处理之同义词替换
6 E: ~) h7 {, @: e: D 3.11 - 数据处理之提取文章中的第一张图片
: k3 T- I6 R3 z W 3.12 - 数据处理之空内容缺省值" V5 o; }6 }4 L* M- v- {
3.13 - 数据处理之内容前后缀
8 M9 n. X6 u- V* K 3.14 - 数据处理之随机插入; O( F" m/ \8 x h) ^8 t4 O9 {. e
3.15- 数据处理之OCR图片识别
. n9 z1 n8 ?+ |. c7 O 3.16 - 数据处理之对单网址进行补全* R) H* _6 } d- _
3.17 - 数据处理之文件下载的设置方法
5 U& G5 Z9 ^/ B+ G7 Q 3.18 - 数据处理之内容过滤相关设置* T. D6 j0 O; [) T5 n
3.19 - 自定义固定格式的数据
; F6 H. }& u$ E% u3 L1 @1 d* w 3.20- 如何循环采集一些数据
9 ?- V1 p# }+ n2 L% D9 S2 l+ W 3.21 - 如何采集网址中的数据2 k, g2 J$ C/ h1 ]! f0 A
4.1 - Web在线发布到网址的设置方式& R1 @$ F _4 f/ r; [3 V4 e
4.2 - 将采集到的数据保存为本地TXT文件形式3 k# Y) }, \" c. k. ?3 ~: q
4.3 - 将采集到的数据保存为本地Word文件形式
0 t6 h s7 G+ e 4.4 - 将采集到的数据保存为本地Excel文件形式
) h6 x$ R. I& _. e; C' m 4.5- 将采集到的数据保存为本地Html文件形式. R5 E1 x" f8 {
4.6 - 将采集到的数据保存为本地Csv文件形式) B1 O5 \. r2 {' P
4.7 - 将采集到的数据导入到自定义数据库
$ g6 }7 M7 c; h6 V1 S7 r6 S. ?! G 4.8 - 发布数据完成之后可以对数据进行哪些操作
$ G) i: U7 o- g; r! k! U. @3 U 4.9 - 如何控制每次发布的数据的条数& W5 h% s3 H. `7 j5 z
5.1 - 任务运行时线程设置的讲解& M& S! d* X# d& {
5.2 - 文件下载设置的相关注意事项
8 y) I9 g/ G' A* W$ m+ j" | 5.3 - FTP同步文件上传如何设置
5 N! b: N, n9 G) i: O. k 5.4 - 如何给采集到的图片加上水印0 _- b" A. m9 G( O3 ^) L5 l# D
2 W2 g+ i& }8 i& M1 ?3 r5 A
|
|