QQ登录

只需要一步,快速开始

APP扫码登录

只需要一步,快速开始

查看: 4829|回复: 0

使用火车头采集器入门教程

[复制链接]

等级头衔

积分成就    金币 : 2861
   泡泡 : 1516
   精华 : 6
   在线时间 : 1328 小时
   最后登录 : 2026-5-15

丰功伟绩

优秀达人突出贡献荣誉管理论坛元老活跃会员

联系方式
发表于 2021-6-17 10:17:51 | 显示全部楼层 |阅读模式
       学会火车头采集器的使用,实操教您自定义一些格式规则来采集,然后保存到word或者excel又或者html的形,帮助您提高效率。适合人群:具有一定网站知识基础的网站编辑、SEOER、想提高自己对数据采集、网络营销从业者,需要大量数据的、电话营销从业者、和合成效率的人。
" U1 J8 h/ y' w2 v" K课程目录:
4 h" n* y- Z! E+ U$ d- e; b  u8 j  1.1- 火车头采集器的安装和功能简介
; e! _& g5 q" h8 _' J  1.2 - 火车头采集器的相关术语5 E8 E( I, N/ y$ Q6 D! ~8 \
  1.3 - 火车头采集器的学习建议
9 x" \. F, B+ J' N( k" S" y& i8 S  2.1 - 如何添加需要采集的单条网址9 ]- o* n  V) X: M4 V
  2.2 - 如何添加批量和多页网址
. Q% \# F$ z# [2 a  2.3 - 如何导入txt网址到开始采集地址! |1 w: w# a) S3 o; [: ^0 T$ f
  2.4 - 如何获取Rss地址中的网址作为起始网址+ ]2 d4 @: b+ h
  2.5 - 如何自定义一些网址的格式来采集新的数据
! d% t8 \6 ?  l% f  2.6 - 多级网址采集规则之从页面自动分析得到地址链接# Q! `, J* t$ r  W
  2.7- 多级网址采集规则之手动填写链接地址规则
# b% V; ]5 m3 c* `  2.8 - 多级网址采集规则之使用Xpath方式获取网址
5 l7 w* B3 l5 J* T  2.9 - 如何判断Http请求方式?是get还是post?2 ]3 {. _! ?4 k) E
  2.10 - 多级网址采集规则之列表分页获取的方式* L. C* N; H1 u: K& e
  2.11 - 多级网址采集规则之附加参数是什么意思?
* U+ S' P0 [+ Z  3.1 - 提取数据方式有哪些9 |  e. X; c( U& n+ E$ M7 S$ L
  3.2 - 数据处理之内容替换2 B" l  L5 q" F% E
  3.3 - 数据处理之Html标签过滤如何使用4 b. Z; S1 T: _# v: x4 J
  3.4 - 数据处理之字符截取
1 @1 Y+ Q- ]/ u, Q  3.5 - 数据处理之纯正则替换如何使用
: k: D; E3 z( t  l' Q6 F) s% U. O  3.6 - 数据处理之数据转换
. Y- q- `; w) X7 y& ?: ^: ^  3.7 - 数据处理之自动摘要  u) {0 j( y8 P: w7 f! O
  3.8 - 数据处理之自动分词  k/ t  z3 h' u8 G7 J& B- K% m
  3.9 - 数据处理之字符编码和解码
, \: ]& z/ J  L/ m/ j; ~; x+ X- X  3.10 - 数据处理之同义词替换6 K+ q5 ?; Q! S( f7 F5 g- c" l8 F
  3.11 - 数据处理之提取文章中的第一张图片9 R0 N! _+ Z: Q* d! X
  3.12 - 数据处理之空内容缺省值2 `$ _) {: ^, v. N/ y
  3.13 - 数据处理之内容前后缀6 h. e1 k& d! F
  3.14 - 数据处理之随机插入
( n, [/ J7 A9 E# W& [  3.15- 数据处理之OCR图片识别1 b  G' o" T% P. C- W) I% S
  3.16 - 数据处理之对单网址进行补全7 H* [+ d; f* B+ ^. P
  3.17 - 数据处理之文件下载的设置方法
" |, x6 u) S( w! n2 E3 ^6 P  3.18 - 数据处理之内容过滤相关设置( e6 I. C2 {/ E2 J0 x2 a
  3.19 - 自定义固定格式的数据) B2 |7 t- L: n+ J8 G
  3.20- 如何循环采集一些数据. \1 @! U$ B& t% `( p& P+ R
  3.21 - 如何采集网址中的数据
$ ?  Q" t; \( p  L& T8 E9 m  4.1 - Web在线发布到网址的设置方式
0 ?( b# d/ W1 t: _  4.2 - 将采集到的数据保存为本地TXT文件形式# Z. m$ B" x' ^
  4.3 - 将采集到的数据保存为本地Word文件形式
7 U* Z* {. c* j: w  4.4 - 将采集到的数据保存为本地Excel文件形式
/ }( H1 S" o$ W  4.5- 将采集到的数据保存为本地Html文件形式
4 J$ R2 K# _) d/ K$ {6 P  4.6 - 将采集到的数据保存为本地Csv文件形式
5 s( n  S; I2 Z5 a7 y: F$ T* u  4.7 - 将采集到的数据导入到自定义数据库' m5 i: E9 `. @, d1 A
  4.8 - 发布数据完成之后可以对数据进行哪些操作6 }9 f, r0 g1 R! D( K/ K* E
  4.9 - 如何控制每次发布的数据的条数
/ c4 F: Q* I+ w  5.1 - 任务运行时线程设置的讲解
, j. q, y0 Z, Z/ z  5.2 - 文件下载设置的相关注意事项: E+ a% ^# P- e  F  S& p, j
  5.3 - FTP同步文件上传如何设置
- r2 X3 s8 @! [( y! x8 u  5.4 - 如何给采集到的图片加上水印7 _9 U3 I& S$ S; ^; ~* k$ r8 h6 G
- N4 V! G4 W7 ?
1.jpg
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|paopaomj.COM ( 渝ICP备18007172号|渝公网安备50010502503914号 )

GMT+8, 2026-5-29 03:19

Powered by paopaomj X3.5 © 2016-2025 sitemap

快速回复 返回顶部 返回列表