|
|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。& }4 W4 G$ Y6 [( b3 g2 P
课程目录:
9 m) T) v- c5 L( a 1.1- 火车头采集器的安装和功能简介
8 H9 n) l; I9 i( I0 R 1.2 - 火车头采集器的相关术语4 N* E' O6 P3 `/ B% ?) U. {
1.3 - 火车头采集器的学习建议
, r% p$ ^6 f% F: Y: N, i7 S& [ 2.1 - 如何添加需要采集的单条网址# s' T0 D" `7 l$ Z7 p M* w$ }2 Y' f
2.2 - 如何添加批量和多页网址
( c5 u& I; j7 |$ W 2.3 - 如何导入txt网址到开始采集地址; H% {% a+ L7 G! q9 X+ Z+ O
2.4 - 如何获取Rss地址中的网址作为起始网址- o5 u0 U2 W5 Y6 s) ]/ v
2.5 - 如何自定义一些网址的格式来采集新的数据
5 A. {) _) G% R% Z0 [# ]& _# s3 H 2.6 - 多级网址采集规则之从页面自动分析得到地址链接
. t8 D; x" |6 J. z) ^ j" y5 B 2.7- 多级网址采集规则之手动填写链接地址规则
2 I" ~ y+ s6 G2 z1 E8 _) B 2.8 - 多级网址采集规则之使用Xpath方式获取网址
$ E) X7 Q4 w, Y2 S! m 2.9 - 如何判断Http请求方式?是get还是post?
% A1 l) @7 Z! ]! Z( N6 j$ k; L( k 2.10 - 多级网址采集规则之列表分页获取的方式
- s$ L3 S6 p- a' | 2.11 - 多级网址采集规则之附加参数是什么意思?# Z/ |# L" U [8 C" v
3.1 - 提取数据方式有哪些
. @9 W0 w7 e8 ~. _* s1 J 3.2 - 数据处理之内容替换: }3 ?: N ~" }6 H3 s# [* Q
3.3 - 数据处理之Html标签过滤如何使用
3 H6 }% w- H* {% ?- J& d+ m/ k 3.4 - 数据处理之字符截取
7 h* H- e7 @7 J0 q/ y1 O$ K3 `0 c 3.5 - 数据处理之纯正则替换如何使用% U+ P* q8 o) O5 G4 z
3.6 - 数据处理之数据转换; N! z t6 a/ k6 _& I: C
3.7 - 数据处理之自动摘要: k) y, |& e* b) C1 v2 y/ C
3.8 - 数据处理之自动分词
. I1 N9 i+ p+ k 3.9 - 数据处理之字符编码和解码! b8 r4 M' @ d' t7 ?
3.10 - 数据处理之同义词替换/ y5 V2 r1 j" f! z- s7 [
3.11 - 数据处理之提取文章中的第一张图片7 n! Z, y$ X# v# O
3.12 - 数据处理之空内容缺省值
$ _2 _* `! @+ y) E: Q& \ 3.13 - 数据处理之内容前后缀1 u" M/ h- y: J
3.14 - 数据处理之随机插入 m( |# j/ j' H
3.15- 数据处理之OCR图片识别$ n1 z, U4 U$ i+ I7 t6 I
3.16 - 数据处理之对单网址进行补全3 p |# }# ^5 h* w1 G6 b
3.17 - 数据处理之文件下载的设置方法
% K: }9 |) W1 ^: S7 w! X1 ^ 3.18 - 数据处理之内容过滤相关设置, j u$ n' p% c
3.19 - 自定义固定格式的数据
+ K4 w9 _# n* _4 B4 F( ~ 3.20- 如何循环采集一些数据% g% I/ Y+ x. ]# \9 m
3.21 - 如何采集网址中的数据; K& c' Y3 H. [; q* q
4.1 - Web在线发布到网址的设置方式! l# {5 h$ t) _) j
4.2 - 将采集到的数据保存为本地TXT文件形式4 i$ O. t0 g" |/ }6 f2 I2 E* t- z
4.3 - 将采集到的数据保存为本地Word文件形式! L9 Z$ H/ E1 [: b
4.4 - 将采集到的数据保存为本地Excel文件形式6 R. j) x0 c' i( T% c
4.5- 将采集到的数据保存为本地Html文件形式0 @0 Y! X4 t5 U5 _9 \
4.6 - 将采集到的数据保存为本地Csv文件形式
, z9 r/ Y7 b7 D3 l" P" B 4.7 - 将采集到的数据导入到自定义数据库
: y+ b* s6 i7 w! b$ l% Y( D 4.8 - 发布数据完成之后可以对数据进行哪些操作
4 D) _# b) @' J; o 4.9 - 如何控制每次发布的数据的条数' d$ T( v t" ?* @
5.1 - 任务运行时线程设置的讲解
* r2 {0 X& t! x0 _* @ 5.2 - 文件下载设置的相关注意事项
# X; V0 p3 M- D7 Q# L8 w# e" R$ h 5.3 - FTP同步文件上传如何设置6 B) F8 N; v* I+ X/ K
5.4 - 如何给采集到的图片加上水印% y0 J( [- @4 X/ c4 Z8 n
4 ]- j! M) w8 y4 H; E* N4 b3 t
|
|