|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。; O! Z3 b/ F" D' ^+ R
课程目录:
, U) u1 D: D' @1 c6 K9 [" O% b 1.1- 火车头采集器的安装和功能简介8 P) R9 }* a+ a# G; d% F: ?: I
1.2 - 火车头采集器的相关术语) o6 U4 V' S# v" U6 O. E9 e: h
1.3 - 火车头采集器的学习建议
5 Q6 q8 W* K# _. T4 i 2.1 - 如何添加需要采集的单条网址/ r& @) v. Z- c' P5 N7 L
2.2 - 如何添加批量和多页网址
M+ X! W8 F4 p- u: e* N& B 2.3 - 如何导入txt网址到开始采集地址
8 \! {; B1 ]& U" B% t 2.4 - 如何获取Rss地址中的网址作为起始网址
4 T, c/ g; o* m! ]9 d2 O 2.5 - 如何自定义一些网址的格式来采集新的数据+ w& h% v1 c( ^9 W. n
2.6 - 多级网址采集规则之从页面自动分析得到地址链接- F7 w* ^( a8 ]5 a: K
2.7- 多级网址采集规则之手动填写链接地址规则
# F. C- i" t4 X. H 2.8 - 多级网址采集规则之使用Xpath方式获取网址3 o& {) C& x3 A6 {! p: P
2.9 - 如何判断Http请求方式?是get还是post?- Z1 e. m8 H D
2.10 - 多级网址采集规则之列表分页获取的方式! \: n7 H& S, I# `5 a9 ^
2.11 - 多级网址采集规则之附加参数是什么意思?
1 U, _0 @- \; M, m9 n 3.1 - 提取数据方式有哪些; x. V$ V( a+ e' T7 \7 d J$ H; X
3.2 - 数据处理之内容替换1 ^6 j9 L' `8 \0 U$ H" j( Z
3.3 - 数据处理之Html标签过滤如何使用
% r6 K3 ~3 ^3 p0 R; J5 b 3.4 - 数据处理之字符截取/ Y) L* \* B9 u G
3.5 - 数据处理之纯正则替换如何使用, s: i( E5 l$ [
3.6 - 数据处理之数据转换% b/ O6 {# i9 W) T- Z1 d# L
3.7 - 数据处理之自动摘要, n; ], A' W0 m/ j; G& |
3.8 - 数据处理之自动分词
* ]% k2 k; F0 k! `$ u 3.9 - 数据处理之字符编码和解码
) z# c+ ]+ A; Q0 p$ x v; y6 [ 3.10 - 数据处理之同义词替换
: Q$ Z4 l7 g% s% ~) x 3.11 - 数据处理之提取文章中的第一张图片
* R4 n$ L4 ^: | 3.12 - 数据处理之空内容缺省值7 w' d& l; x3 X3 x9 w4 t
3.13 - 数据处理之内容前后缀& m/ _' j* l+ U
3.14 - 数据处理之随机插入. K6 h& D. d- T, e* d
3.15- 数据处理之OCR图片识别* L) H. C& p6 R0 X2 n4 e" P, p) Y
3.16 - 数据处理之对单网址进行补全8 h% x. u2 Z4 d3 ~) t2 n" A
3.17 - 数据处理之文件下载的设置方法
) q3 [1 c' b% ^( M( C3 s 3.18 - 数据处理之内容过滤相关设置
, f# a9 y* W! d- f 3.19 - 自定义固定格式的数据
4 o" z6 ~$ [% V/ \- M" {6 M/ s! n 3.20- 如何循环采集一些数据
! O I/ L3 R1 O/ N: E* N 3.21 - 如何采集网址中的数据' L8 |" ]2 Q$ G# s- z2 ~
4.1 - Web在线发布到网址的设置方式# G' H1 p) D0 p0 S% J) j
4.2 - 将采集到的数据保存为本地TXT文件形式" r. V4 r) `. I- H; K' r7 s
4.3 - 将采集到的数据保存为本地Word文件形式
8 N# A! G3 ?1 @' g* O, ^* F% n4 n 4.4 - 将采集到的数据保存为本地Excel文件形式
9 y+ g3 u( B* ^ 4.5- 将采集到的数据保存为本地Html文件形式& v. `# ^5 t% T' I, k4 n
4.6 - 将采集到的数据保存为本地Csv文件形式6 ?& ~; S* e- l" z$ M
4.7 - 将采集到的数据导入到自定义数据库
" `& }: b: B$ X) v; Z1 h/ U F 4.8 - 发布数据完成之后可以对数据进行哪些操作/ n8 d7 Q9 H% }7 @" H: Z
4.9 - 如何控制每次发布的数据的条数: V$ Z5 ?8 z! A8 v3 c: e7 G8 p
5.1 - 任务运行时线程设置的讲解
7 W& r0 m: `/ P! ?& T/ l9 v( S 5.2 - 文件下载设置的相关注意事项
6 j8 s1 z: L- V& b& a' |! j 5.3 - FTP同步文件上传如何设置3 U+ l+ C# R+ E6 ]
5.4 - 如何给采集到的图片加上水印
* \8 {: u9 V! Z: o# R) o" ^% S 4 `) S2 e6 n6 a2 Q' _. P
|
|