QQ登录

只需要一步,快速开始

APP扫码登录

只需要一步,快速开始

查看: 4642|回复: 0

使用火车头采集器入门教程

[复制链接]

等级头衔

积分成就    金币 : 2861
   泡泡 : 1516
   精华 : 6
   在线时间 : 1323 小时
   最后登录 : 2026-3-2

丰功伟绩

优秀达人突出贡献荣誉管理论坛元老活跃会员

联系方式
发表于 2021-6-17 10:17:51 | 显示全部楼层 |阅读模式
       学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
) ]; c% s  d" ~  a* ~1 r0 ~6 `, |课程目录:, s& u  O7 a' A  l# a
  1.1- 火车头采集器的安装和功能简介1 w( `. S7 n0 c- g* v5 {
  1.2 - 火车头采集器的相关术语
9 a4 U$ s  X5 y: K6 w) S+ O  1.3 - 火车头采集器的学习建议. y# b( d) g: z
  2.1 - 如何添加需要采集的单条网址
* j0 K& t& O4 c  2.2 - 如何添加批量和多页网址
1 @2 }$ ]( f/ z, n  2.3 - 如何导入txt网址到开始采集地址; l& I5 _& {6 D! y9 d
  2.4 - 如何获取Rss地址中的网址作为起始网址# }' R3 Y$ b3 c0 r: F1 @
  2.5 - 如何自定义一些网址的格式来采集新的数据4 c" X8 {, `1 E
  2.6 - 多级网址采集规则之从页面自动分析得到地址链接
* m7 T$ T- \( v3 e, K: u5 [7 N, X9 j  2.7- 多级网址采集规则之手动填写链接地址规则
- @) w3 o' ^, S. l( L) z* `  2.8 - 多级网址采集规则之使用Xpath方式获取网址
6 D7 F" t/ E, W9 r  2.9 - 如何判断Http请求方式?是get还是post?
$ B8 x" L8 l  t4 O  2.10 - 多级网址采集规则之列表分页获取的方式0 ~. B; |2 n5 W0 z- h
  2.11 - 多级网址采集规则之附加参数是什么意思?8 B) @- k  T8 p& s: w' U3 R+ P
  3.1 - 提取数据方式有哪些
- J- b/ l& s( `8 j% [' V! o  3.2 - 数据处理之内容替换7 x5 K8 ^& x: S
  3.3 - 数据处理之Html标签过滤如何使用( w9 ~" C  Y9 ~1 W0 L% c
  3.4 - 数据处理之字符截取
+ R, G' y: A( q9 c; ^8 Z8 L$ T  3.5 - 数据处理之纯正则替换如何使用& u: N. q# @. i# g- P$ b
  3.6 - 数据处理之数据转换- ?1 U4 C! O$ a+ P* e7 I: @
  3.7 - 数据处理之自动摘要, t/ @- J- x9 B5 G4 N3 ~
  3.8 - 数据处理之自动分词
$ r8 g9 p& A$ t( }3 D  3.9 - 数据处理之字符编码和解码+ G* V: C4 n: S% W3 V  O) ^
  3.10 - 数据处理之同义词替换
8 Z  x) L  S: B/ X# N2 Z4 I  3.11 - 数据处理之提取文章中的第一张图片3 w' r' @, O) A. \7 F$ [
  3.12 - 数据处理之空内容缺省值5 K- \/ r3 Y8 ?) ]  B5 e
  3.13 - 数据处理之内容前后缀' I6 _# f8 |6 x
  3.14 - 数据处理之随机插入
/ ?# l$ q: z7 p0 ^) Q6 Z% B; ?8 w* C. l- e  3.15- 数据处理之OCR图片识别6 X( L* `/ C! p9 M/ F
  3.16 - 数据处理之对单网址进行补全0 D/ p- J. B& X7 N( P; @
  3.17 - 数据处理之文件下载的设置方法  I/ e6 C8 u" d8 Z; a$ D
  3.18 - 数据处理之内容过滤相关设置$ i- a7 J  E6 x' d1 s" x8 v4 G) [5 J: I+ p
  3.19 - 自定义固定格式的数据
# n" p9 H1 f3 n$ U  3.20- 如何循环采集一些数据( G  b6 \, c- X0 F0 A
  3.21 - 如何采集网址中的数据% N" H$ _/ V3 }  w- b
  4.1 - Web在线发布到网址的设置方式
" {: k1 S4 H  H# |  4.2 - 将采集到的数据保存为本地TXT文件形式2 o+ X, m, }4 y: w, U: F, `
  4.3 - 将采集到的数据保存为本地Word文件形式2 `1 u4 ?0 X. m0 ~. E
  4.4 - 将采集到的数据保存为本地Excel文件形式8 ?. r4 ~% L4 L3 v) _# }
  4.5- 将采集到的数据保存为本地Html文件形式% z7 U; G$ ?: v% w  e
  4.6 - 将采集到的数据保存为本地Csv文件形式
( x8 P1 l) ?5 X+ C  Z9 n/ X  4.7 - 将采集到的数据导入到自定义数据库
% R6 {  i. A& ^0 Y7 j  4.8 - 发布数据完成之后可以对数据进行哪些操作5 `3 _: {/ V, Z7 r8 Z) |
  4.9 - 如何控制每次发布的数据的条数
( x  ]1 [! ~4 Z% F2 J  5.1 - 任务运行时线程设置的讲解/ W8 K# G! j1 p' L# u$ k
  5.2 - 文件下载设置的相关注意事项: S  Z& V9 b* E! n4 s4 h3 n
  5.3 - FTP同步文件上传如何设置% X4 G8 S. T* W; N
  5.4 - 如何给采集到的图片加上水印% b0 I: G( u" `+ d/ R
6 a2 ?7 ^. J) p9 J1 `: D2 W! o1 x
1.jpg
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|paopaomj.COM ( 渝ICP备18007172号|渝公网安备50010502503914号 )

GMT+8, 2026-3-4 07:18

Powered by paopaomj X3.5 © 2016-2025 sitemap

快速回复 返回顶部 返回列表