|
|
学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
) ]; c% s d" ~ a* ~1 r0 ~6 `, |课程目录:, s& u O7 a' A l# a
1.1- 火车头采集器的安装和功能简介1 w( `. S7 n0 c- g* v5 {
1.2 - 火车头采集器的相关术语
9 a4 U$ s X5 y: K6 w) S+ O 1.3 - 火车头采集器的学习建议. y# b( d) g: z
2.1 - 如何添加需要采集的单条网址
* j0 K& t& O4 c 2.2 - 如何添加批量和多页网址
1 @2 }$ ]( f/ z, n 2.3 - 如何导入txt网址到开始采集地址; l& I5 _& {6 D! y9 d
2.4 - 如何获取Rss地址中的网址作为起始网址# }' R3 Y$ b3 c0 r: F1 @
2.5 - 如何自定义一些网址的格式来采集新的数据4 c" X8 {, `1 E
2.6 - 多级网址采集规则之从页面自动分析得到地址链接
* m7 T$ T- \( v3 e, K: u5 [7 N, X9 j 2.7- 多级网址采集规则之手动填写链接地址规则
- @) w3 o' ^, S. l( L) z* ` 2.8 - 多级网址采集规则之使用Xpath方式获取网址
6 D7 F" t/ E, W9 r 2.9 - 如何判断Http请求方式?是get还是post?
$ B8 x" L8 l t4 O 2.10 - 多级网址采集规则之列表分页获取的方式0 ~. B; |2 n5 W0 z- h
2.11 - 多级网址采集规则之附加参数是什么意思?8 B) @- k T8 p& s: w' U3 R+ P
3.1 - 提取数据方式有哪些
- J- b/ l& s( `8 j% [' V! o 3.2 - 数据处理之内容替换7 x5 K8 ^& x: S
3.3 - 数据处理之Html标签过滤如何使用( w9 ~" C Y9 ~1 W0 L% c
3.4 - 数据处理之字符截取
+ R, G' y: A( q9 c; ^8 Z8 L$ T 3.5 - 数据处理之纯正则替换如何使用& u: N. q# @. i# g- P$ b
3.6 - 数据处理之数据转换- ?1 U4 C! O$ a+ P* e7 I: @
3.7 - 数据处理之自动摘要, t/ @- J- x9 B5 G4 N3 ~
3.8 - 数据处理之自动分词
$ r8 g9 p& A$ t( }3 D 3.9 - 数据处理之字符编码和解码+ G* V: C4 n: S% W3 V O) ^
3.10 - 数据处理之同义词替换
8 Z x) L S: B/ X# N2 Z4 I 3.11 - 数据处理之提取文章中的第一张图片3 w' r' @, O) A. \7 F$ [
3.12 - 数据处理之空内容缺省值5 K- \/ r3 Y8 ?) ] B5 e
3.13 - 数据处理之内容前后缀' I6 _# f8 |6 x
3.14 - 数据处理之随机插入
/ ?# l$ q: z7 p0 ^) Q6 Z% B; ?8 w* C. l- e 3.15- 数据处理之OCR图片识别6 X( L* `/ C! p9 M/ F
3.16 - 数据处理之对单网址进行补全0 D/ p- J. B& X7 N( P; @
3.17 - 数据处理之文件下载的设置方法 I/ e6 C8 u" d8 Z; a$ D
3.18 - 数据处理之内容过滤相关设置$ i- a7 J E6 x' d1 s" x8 v4 G) [5 J: I+ p
3.19 - 自定义固定格式的数据
# n" p9 H1 f3 n$ U 3.20- 如何循环采集一些数据( G b6 \, c- X0 F0 A
3.21 - 如何采集网址中的数据% N" H$ _/ V3 } w- b
4.1 - Web在线发布到网址的设置方式
" {: k1 S4 H H# | 4.2 - 将采集到的数据保存为本地TXT文件形式2 o+ X, m, }4 y: w, U: F, `
4.3 - 将采集到的数据保存为本地Word文件形式2 `1 u4 ?0 X. m0 ~. E
4.4 - 将采集到的数据保存为本地Excel文件形式8 ?. r4 ~% L4 L3 v) _# }
4.5- 将采集到的数据保存为本地Html文件形式% z7 U; G$ ?: v% w e
4.6 - 将采集到的数据保存为本地Csv文件形式
( x8 P1 l) ?5 X+ C Z9 n/ X 4.7 - 将采集到的数据导入到自定义数据库
% R6 { i. A& ^0 Y7 j 4.8 - 发布数据完成之后可以对数据进行哪些操作5 `3 _: {/ V, Z7 r8 Z) |
4.9 - 如何控制每次发布的数据的条数
( x ]1 [! ~4 Z% F2 J 5.1 - 任务运行时线程设置的讲解/ W8 K# G! j1 p' L# u$ k
5.2 - 文件下载设置的相关注意事项: S Z& V9 b* E! n4 s4 h3 n
5.3 - FTP同步文件上传如何设置% X4 G8 S. T* W; N
5.4 - 如何给采集到的图片加上水印% b0 I: G( u" `+ d/ R
6 a2 ?7 ^. J) p9 J1 `: D2 W! o1 x
|
|