|
|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
" U1 J8 h/ y' w2 v" K课程目录:
4 h" n* y- Z! E+ U$ d- e; b u8 j 1.1- 火车头采集器的安装和功能简介
; e! _& g5 q" h8 _' J 1.2 - 火车头采集器的相关术语5 E8 E( I, N/ y$ Q6 D! ~8 \
1.3 - 火车头采集器的学习建议
9 x" \. F, B+ J' N( k" S" y& i8 S 2.1 - 如何添加需要采集的单条网址9 ]- o* n V) X: M4 V
2.2 - 如何添加批量和多页网址
. Q% \# F$ z# [2 a 2.3 - 如何导入txt网址到开始采集地址! |1 w: w# a) S3 o; [: ^0 T$ f
2.4 - 如何获取Rss地址中的网址作为起始网址+ ]2 d4 @: b+ h
2.5 - 如何自定义一些网址的格式来采集新的数据
! d% t8 \6 ? l% f 2.6 - 多级网址采集规则之从页面自动分析得到地址链接# Q! `, J* t$ r W
2.7- 多级网址采集规则之手动填写链接地址规则
# b% V; ]5 m3 c* ` 2.8 - 多级网址采集规则之使用Xpath方式获取网址
5 l7 w* B3 l5 J* T 2.9 - 如何判断Http请求方式?是get还是post?2 ]3 {. _! ?4 k) E
2.10 - 多级网址采集规则之列表分页获取的方式* L. C* N; H1 u: K& e
2.11 - 多级网址采集规则之附加参数是什么意思?
* U+ S' P0 [+ Z 3.1 - 提取数据方式有哪些9 | e. X; c( U& n+ E$ M7 S$ L
3.2 - 数据处理之内容替换2 B" l L5 q" F% E
3.3 - 数据处理之Html标签过滤如何使用4 b. Z; S1 T: _# v: x4 J
3.4 - 数据处理之字符截取
1 @1 Y+ Q- ]/ u, Q 3.5 - 数据处理之纯正则替换如何使用
: k: D; E3 z( t l' Q6 F) s% U. O 3.6 - 数据处理之数据转换
. Y- q- `; w) X7 y& ?: ^: ^ 3.7 - 数据处理之自动摘要 u) {0 j( y8 P: w7 f! O
3.8 - 数据处理之自动分词 k/ t z3 h' u8 G7 J& B- K% m
3.9 - 数据处理之字符编码和解码
, \: ]& z/ J L/ m/ j; ~; x+ X- X 3.10 - 数据处理之同义词替换6 K+ q5 ?; Q! S( f7 F5 g- c" l8 F
3.11 - 数据处理之提取文章中的第一张图片9 R0 N! _+ Z: Q* d! X
3.12 - 数据处理之空内容缺省值2 `$ _) {: ^, v. N/ y
3.13 - 数据处理之内容前后缀6 h. e1 k& d! F
3.14 - 数据处理之随机插入
( n, [/ J7 A9 E# W& [ 3.15- 数据处理之OCR图片识别1 b G' o" T% P. C- W) I% S
3.16 - 数据处理之对单网址进行补全7 H* [+ d; f* B+ ^. P
3.17 - 数据处理之文件下载的设置方法
" |, x6 u) S( w! n2 E3 ^6 P 3.18 - 数据处理之内容过滤相关设置( e6 I. C2 {/ E2 J0 x2 a
3.19 - 自定义固定格式的数据) B2 |7 t- L: n+ J8 G
3.20- 如何循环采集一些数据. \1 @! U$ B& t% `( p& P+ R
3.21 - 如何采集网址中的数据
$ ? Q" t; \( p L& T8 E9 m 4.1 - Web在线发布到网址的设置方式
0 ?( b# d/ W1 t: _ 4.2 - 将采集到的数据保存为本地TXT文件形式# Z. m$ B" x' ^
4.3 - 将采集到的数据保存为本地Word文件形式
7 U* Z* {. c* j: w 4.4 - 将采集到的数据保存为本地Excel文件形式
/ }( H1 S" o$ W 4.5- 将采集到的数据保存为本地Html文件形式
4 J$ R2 K# _) d/ K$ {6 P 4.6 - 将采集到的数据保存为本地Csv文件形式
5 s( n S; I2 Z5 a7 y: F$ T* u 4.7 - 将采集到的数据导入到自定义数据库' m5 i: E9 `. @, d1 A
4.8 - 发布数据完成之后可以对数据进行哪些操作6 }9 f, r0 g1 R! D( K/ K* E
4.9 - 如何控制每次发布的数据的条数
/ c4 F: Q* I+ w 5.1 - 任务运行时线程设置的讲解
, j. q, y0 Z, Z/ z 5.2 - 文件下载设置的相关注意事项: E+ a% ^# P- e F S& p, j
5.3 - FTP同步文件上传如何设置
- r2 X3 s8 @! [( y! x8 u 5.4 - 如何给采集到的图片加上水印7 _9 U3 I& S$ S; ^; ~* k$ r8 h6 G
- N4 V! G4 W7 ?
|
|