|
|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。. i9 e; O7 K c2 D
课程目录: R9 k5 t3 ]: G* q1 ~. ^. G
1.1- 火车头采集器的安装和功能简介( t% y' Q. `1 c" _ |
1.2 - 火车头采集器的相关术语
# H* z) C, _. b: a 1.3 - 火车头采集器的学习建议1 ?" ^0 V' Z; O( h
2.1 - 如何添加需要采集的单条网址& q& X& A/ U0 K5 m4 T8 [0 c- e, K
2.2 - 如何添加批量和多页网址
4 ~8 V1 R5 p- Z, q 2.3 - 如何导入txt网址到开始采集地址
9 _) |9 q$ v( T2 b: U 2.4 - 如何获取Rss地址中的网址作为起始网址
) b q% G. M2 R, C2 | 2.5 - 如何自定义一些网址的格式来采集新的数据: q& m# j2 R# @" V+ D
2.6 - 多级网址采集规则之从页面自动分析得到地址链接$ }& D( z6 C' X. }! Q% q
2.7- 多级网址采集规则之手动填写链接地址规则
" D% @) {" q- l/ P$ m0 u# `$ I3 Y* M9 }/ a 2.8 - 多级网址采集规则之使用Xpath方式获取网址5 [$ s7 D5 G, h) S' k3 l3 s8 P! U
2.9 - 如何判断Http请求方式?是get还是post?: c& ?2 u! H# T# Y1 ?
2.10 - 多级网址采集规则之列表分页获取的方式
! y, }( W+ A9 s, ~ 2.11 - 多级网址采集规则之附加参数是什么意思?" N z( f) ?/ l, M( d: O8 N/ F/ S
3.1 - 提取数据方式有哪些. i7 {" b' O( ]( c8 }
3.2 - 数据处理之内容替换
n6 V; R( q- T6 j' \# l+ ?, I4 r 3.3 - 数据处理之Html标签过滤如何使用+ I- |% K+ Q- x: T* t
3.4 - 数据处理之字符截取$ B; n% V& s+ @( V
3.5 - 数据处理之纯正则替换如何使用$ I/ Q# ?2 s9 E8 F2 @" z' w r2 P* x
3.6 - 数据处理之数据转换
& C1 r' y" _, j. r 3.7 - 数据处理之自动摘要* H9 x# ?2 L/ Z. E& T. W
3.8 - 数据处理之自动分词- l- B& D# C: q% J
3.9 - 数据处理之字符编码和解码4 R3 T' t" \! w7 u' O
3.10 - 数据处理之同义词替换
) ]6 |, T5 H+ k. q" S 3.11 - 数据处理之提取文章中的第一张图片9 z0 {7 N! K8 w+ o, `! C( K
3.12 - 数据处理之空内容缺省值
3 N, I- x2 u/ u* l/ k 3.13 - 数据处理之内容前后缀) ]- w: j7 }( Q d H% e3 v
3.14 - 数据处理之随机插入& |- x( S% a7 {! j1 ~& _
3.15- 数据处理之OCR图片识别
; p; w( X0 o2 v7 b b7 s0 ` 3.16 - 数据处理之对单网址进行补全
3 P7 w/ y f) k/ U 3.17 - 数据处理之文件下载的设置方法
) F. y) M2 C! N9 s% I. @/ X 3.18 - 数据处理之内容过滤相关设置6 R# y% K; W [9 s& m7 ?: S
3.19 - 自定义固定格式的数据' y1 G ?4 \- O$ W Z8 X1 O3 Q
3.20- 如何循环采集一些数据
. y0 ?% c; m# u( W2 _6 I 3.21 - 如何采集网址中的数据
3 v. N+ k0 g, p: B 4.1 - Web在线发布到网址的设置方式" P) p6 W: [9 G/ a6 p, z. J) K
4.2 - 将采集到的数据保存为本地TXT文件形式
) i* ~$ k L2 a" s, { 4.3 - 将采集到的数据保存为本地Word文件形式
( W8 h% _/ n1 R- T- `" v, W' t l3 d 4.4 - 将采集到的数据保存为本地Excel文件形式
4 y; |' q# w9 m1 X* J) Z5 ^ 4.5- 将采集到的数据保存为本地Html文件形式9 \3 e" k. Y. q# e5 a( b0 v& B% u
4.6 - 将采集到的数据保存为本地Csv文件形式9 O5 E0 E. Q/ f) g6 Q x
4.7 - 将采集到的数据导入到自定义数据库8 E1 N* D6 [6 E6 S' _
4.8 - 发布数据完成之后可以对数据进行哪些操作
0 b; [0 w1 H4 I6 n7 T( J2 [% M 4.9 - 如何控制每次发布的数据的条数8 z. G6 P# p( r7 O' A! u$ `3 e) b6 I
5.1 - 任务运行时线程设置的讲解
! }& ~6 w6 g. q& n! k 5.2 - 文件下载设置的相关注意事项8 V& U' k$ G! f; h5 y0 S y
5.3 - FTP同步文件上传如何设置
9 l' J3 m1 j |9 T" L* Q 5.4 - 如何给采集到的图片加上水印
7 [: W: `' m3 S" {
, y: C6 }8 @4 s% N" H5 F
|
|