|
|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
, h6 D- P3 A8 K5 q2 A; \课程目录:
) M& s- S' P5 K9 h 1.1- 火车头采集器的安装和功能简介
, g" @% P8 o" @! [9 E 1.2 - 火车头采集器的相关术语
1 [" i6 g& O1 `' n- M 1.3 - 火车头采集器的学习建议" h b5 Y: g+ e$ u+ {
2.1 - 如何添加需要采集的单条网址0 G( p" l$ t8 i2 k3 C2 N: I
2.2 - 如何添加批量和多页网址
% H) b2 D$ Y3 [ 2.3 - 如何导入txt网址到开始采集地址6 J( p I$ H. g5 |/ n& I# h
2.4 - 如何获取Rss地址中的网址作为起始网址
8 J: s5 l) I) p) L' R2 @ 2.5 - 如何自定义一些网址的格式来采集新的数据
8 M7 I N4 l: L+ o1 C$ F+ O 2.6 - 多级网址采集规则之从页面自动分析得到地址链接7 k$ K2 `; S6 s' s
2.7- 多级网址采集规则之手动填写链接地址规则
" H) r# r$ G5 o% G 2.8 - 多级网址采集规则之使用Xpath方式获取网址; n/ S& B* Q" t6 U- L2 I- s
2.9 - 如何判断Http请求方式?是get还是post?* N2 x1 B6 N, U- {
2.10 - 多级网址采集规则之列表分页获取的方式* R/ a8 F3 x! u* m' L
2.11 - 多级网址采集规则之附加参数是什么意思?- B9 V: Y) A$ `
3.1 - 提取数据方式有哪些% n; J2 T; ?! A. g" O5 ~$ j3 s
3.2 - 数据处理之内容替换' }% {, R: |$ [! f; \2 x
3.3 - 数据处理之Html标签过滤如何使用, B( C' u' m6 M- l9 z- \1 g5 L
3.4 - 数据处理之字符截取
: s$ o' J$ O# y7 o' u 3.5 - 数据处理之纯正则替换如何使用1 c2 p: `& q2 r8 u# t, D
3.6 - 数据处理之数据转换- j- j" E( `% l$ s Z+ c" w
3.7 - 数据处理之自动摘要% f2 _" m# E7 {/ M( J
3.8 - 数据处理之自动分词
6 w3 u& \/ z l6 V' c9 K* F- p. | 3.9 - 数据处理之字符编码和解码
! z$ M5 i( C `: ? 3.10 - 数据处理之同义词替换2 A) F$ z9 |6 s7 x
3.11 - 数据处理之提取文章中的第一张图片 b# g. l7 x8 R9 R7 n* V x
3.12 - 数据处理之空内容缺省值" v# \7 @! Z- v
3.13 - 数据处理之内容前后缀
7 \& _2 h2 V) [/ G* _5 D 3.14 - 数据处理之随机插入
3 |7 k! c& W, L1 L' | 3.15- 数据处理之OCR图片识别
( m& y9 A' x" e; B. n) O8 h( n 3.16 - 数据处理之对单网址进行补全
! T$ y2 w* m+ ~- x: Q7 n 3.17 - 数据处理之文件下载的设置方法
; Z, s c5 D. S0 f 3.18 - 数据处理之内容过滤相关设置
! ?" O* L/ N. | 3.19 - 自定义固定格式的数据
) m' s5 `- e$ J- C" \% S3 B+ R# x 3.20- 如何循环采集一些数据
4 {: R' D" F# L, Q3 H0 r3 Q 3.21 - 如何采集网址中的数据
% S* N' M. k; j% } 4.1 - Web在线发布到网址的设置方式
9 X5 ~% o4 n4 r' o# | 4.2 - 将采集到的数据保存为本地TXT文件形式7 `7 d$ ?; t8 g4 H3 E f0 V
4.3 - 将采集到的数据保存为本地Word文件形式
0 h, {! C. v3 }. v0 x& q" L) B 4.4 - 将采集到的数据保存为本地Excel文件形式
W9 F3 [# g. L1 J5 ]& ] 4.5- 将采集到的数据保存为本地Html文件形式/ ?$ b6 @/ m% Y/ C
4.6 - 将采集到的数据保存为本地Csv文件形式4 Y1 n8 E/ p" B. K; ?
4.7 - 将采集到的数据导入到自定义数据库
8 J4 {9 A: k+ }( h0 q6 [7 L. c# d, k 4.8 - 发布数据完成之后可以对数据进行哪些操作
5 W: D3 m# @4 f 4.9 - 如何控制每次发布的数据的条数9 p, N' y% T: p3 _1 g' v* j2 a) J
5.1 - 任务运行时线程设置的讲解
/ W5 c7 n+ N+ J1 v* h: }' c+ w7 P 5.2 - 文件下载设置的相关注意事项
, e L- N" J" Y. i8 y( j- ` 5.3 - FTP同步文件上传如何设置9 N0 @" U+ H \: ` K g
5.4 - 如何给采集到的图片加上水印( F& v9 ^* t1 V4 Y4 w7 C% T
0 e3 O7 ~$ j4 b' n
|
|