|
|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
3 ^; A( t+ j* j课程目录:
0 V3 Y- z, H1 u 1.1- 火车头采集器的安装和功能简介
+ ^. v; O7 K6 @ 1.2 - 火车头采集器的相关术语
1 o* Q5 {. s3 v; U! b6 y+ T. Q 1.3 - 火车头采集器的学习建议
/ x. Y3 q( Z1 e# }7 z7 V2 _. R6 ~ 2.1 - 如何添加需要采集的单条网址& J8 W( L p4 Y' R, i1 X: g6 J
2.2 - 如何添加批量和多页网址
% u& |; A, T' S K6 t: N4 o+ H 2.3 - 如何导入txt网址到开始采集地址
! G6 c) v+ \2 ^/ R4 L- J: { 2.4 - 如何获取Rss地址中的网址作为起始网址
" i7 f7 A, D* g! ` 2.5 - 如何自定义一些网址的格式来采集新的数据$ K4 C2 R6 P& ~% i9 j! {
2.6 - 多级网址采集规则之从页面自动分析得到地址链接- D1 d/ o0 F( Y/ D3 }" r/ F$ c/ W H. ^
2.7- 多级网址采集规则之手动填写链接地址规则
' g0 K& E) N- M 2.8 - 多级网址采集规则之使用Xpath方式获取网址6 R, K% S2 O" h2 w h( E1 \' z
2.9 - 如何判断Http请求方式?是get还是post?
' O9 b, [: M3 p7 f' J 2.10 - 多级网址采集规则之列表分页获取的方式) \7 R6 k/ B' e2 f6 ^* q' n% V! D* @
2.11 - 多级网址采集规则之附加参数是什么意思? _" ^9 ]1 n6 C+ }' |) a( z
3.1 - 提取数据方式有哪些
7 w9 h* Q- x0 b' e 3.2 - 数据处理之内容替换
$ ?) r3 l, C$ l' D 3.3 - 数据处理之Html标签过滤如何使用4 Z. g# M- c$ O
3.4 - 数据处理之字符截取5 p0 d; ~6 L6 N' y/ b& G
3.5 - 数据处理之纯正则替换如何使用, h7 `) P/ U; ~3 Q+ m, }
3.6 - 数据处理之数据转换
4 c+ j a* ~1 R% @& L& J! z 3.7 - 数据处理之自动摘要5 Q4 i' F/ z5 G5 y5 g4 P; _" c# P
3.8 - 数据处理之自动分词
$ O: i$ g P% x/ e1 V 3.9 - 数据处理之字符编码和解码
1 f/ l" ]7 H; ^* Q3 l% C5 Q 3.10 - 数据处理之同义词替换
2 Y5 A8 C n* Q8 I* T* Z 3.11 - 数据处理之提取文章中的第一张图片
; B! u9 y p$ |0 n0 F1 Z 3.12 - 数据处理之空内容缺省值
j% L: T0 q" y" T" l, P! y1 s 3.13 - 数据处理之内容前后缀+ }# \. b* T, K9 `, g
3.14 - 数据处理之随机插入
3 F: Y- @7 J6 c6 E4 E8 I; [ 3.15- 数据处理之OCR图片识别
+ M8 A2 ?3 o$ E5 A7 D# V% ~ 3.16 - 数据处理之对单网址进行补全
2 k" C; Z3 Z! r! Z; S9 T 3.17 - 数据处理之文件下载的设置方法
! j# s6 U8 H) N9 D# r/ \ 3.18 - 数据处理之内容过滤相关设置0 i) l" g4 m3 ]- D" ^2 m z) w
3.19 - 自定义固定格式的数据
1 J8 Q" E+ p6 H 3.20- 如何循环采集一些数据
/ p0 m4 M4 n) X0 x0 S 3.21 - 如何采集网址中的数据
5 C( y- _, |& b6 C 4.1 - Web在线发布到网址的设置方式
V+ }& l W8 z% X6 s2 V 4.2 - 将采集到的数据保存为本地TXT文件形式
1 n& k$ t1 q6 p3 O4 ?0 l3 K 4.3 - 将采集到的数据保存为本地Word文件形式
2 X1 g- `2 @+ m& v: e! G 4.4 - 将采集到的数据保存为本地Excel文件形式
1 v0 }0 a$ e3 l% t. I 4.5- 将采集到的数据保存为本地Html文件形式7 r7 w5 D) }0 O3 z
4.6 - 将采集到的数据保存为本地Csv文件形式8 J9 r( A4 Q- b' t
4.7 - 将采集到的数据导入到自定义数据库
& K- F `* j" ?$ e7 b 4.8 - 发布数据完成之后可以对数据进行哪些操作
' z5 Q( d9 `, c0 B7 | 4.9 - 如何控制每次发布的数据的条数
l$ c4 l$ V8 ~, c& m; C E$ b 5.1 - 任务运行时线程设置的讲解
3 j+ S$ q' t& o4 M! Z7 T 5.2 - 文件下载设置的相关注意事项
% W. j% j' X5 ?5 N5 x 5.3 - FTP同步文件上传如何设置
- m$ q- l% L9 k 5.4 - 如何给采集到的图片加上水印7 I8 i: U: K2 M" T; S i
O# {! G+ a7 W5 @+ E
|
|