影刀RPA实操指南:TEMU跨境电商数据采集从零到自动化的完整方案
TEMU是近年跨境电商里增速最快的平台之一。对于做TEMU的运营来说,商品数据监控、竞品价格跟踪、店铺表现分析,这些每天都要做。
手动点几十个页面查数据的效率太低了。
真正需要自动化的,往往不是"能不能做"的问题,而是"一天要做几百次"的重复劳动。
这篇文章用影刀RPA + TEMU平台实战,讲清楚跨境电商自动化采集的正确姿势。
一、TEMU数据采集的难点
和国内电商不一样,TEMU有几个特殊的问题:
| 难点 | 说明 |
|---|---|
| 网络环境 | 需要外网访问,代理必不可少 |
| 页面国际化 | 中英文混排,元素定位需要多语言兼容 |
| 反爬机制 | 比国内平台严格,频率控制很重要 |
| 登录态维护 | Cookie过期比国内平台快 |
| 价格多币种 | 美元标价,清洗时需要转换 |
解决这些难点,关键在于"稳",而不是"快"。
二、环境准备:代理 + 浏览器配置
TEMU 采集第一步是确保能访问:
# 代理配置——在影刀浏览器启动前完成# 方式一:影刀客户端设置全局代理# 路径:影刀设置 → 浏览器 → 代理设置 → 填入代理地址# 方式二:用系统代理# Windows设置 → 网络和Internet → 代理 → 手动设置代理选择建议:
拼多多店群自动化上架方案
- 固定住宅代理:稳定性最优,适合长期采集
- 数据中心代理:速度快但容易被识别,适合短期大批量采集
- 不推荐免费代理:速度慢、不稳定、随时失效
一个实际坑:代理配置后要测试。先手动打开 TEMU 首页确认能加载,再跑自动化流程。不然跑一半才发现没网,时间全白费。
三、TEMU商品搜索的自动化
# TEMU商品搜索采集——标准写法打开网页("https://www.temu.com",浏览器="影刀浏览器")等待元素出现("搜索输入框",10秒)# TEMU加载可能比国内平台慢# 输入关键词(直接搜索框不支持清空,换URL拼接方式)关键词="wireless earbuds"关键词_编码=URL编码(关键词)新URL="https://www.temu.com/search_result.html?search_key="+关键词_编码 打开网页(新URL)等待元素出现("商品列表",10秒)# 采集商品信息获取相似元素列表("商品卡片")->商品列表TEMU 搜索特色:URL 里的
search_key参数可以直接拼接关键词,比操作搜索框更稳。因为 TEMU 的搜索建议弹窗非常积极,键盘回车可能被吞掉。
四、采集商品核心数据
TEMU 商品卡片的信息结构:
# TEMU商品详情采集新建Excel->采集结果表 写入行数据(采集结果表,["商品名称","美元价格","人民币价格","销量","评分","商品链接","采集时间"])遍历列表(商品列表,当前商品):# 商品名称——多语言名称=获取元素文本(当前商品//".product-title")# 美元价格美元价=获取元素文本(当前商品//".price-amount")# 价格清洗:去掉美元符号美元价=替换文本(美元价,"$","")美元价=替换文本(美元价,",","")# $1,299 去掉逗号# 转换成人民币(取当天汇率)汇率=7.25# 建议用API实时获取人民币价=ToNumber(美元价)*汇率# 销量(TEMU很多商品不直接显示销量,用评论数估算)评论数=获取元素文本(当前商品//".review-count")# 评分评分=获取元素文本(当前商品//".rating-score")写入行数据(采集结果表,[名称,美元价,人民币价,评论数,评分,""])价格清洗的细节
TEMU 价格会有各种格式:
$12.99 $1,299.00 From $5.99 $9.99 - $19.99最终清洗脚本:
# Python代码指令——统一价格清洗价格原始="{美元价}"# 从影刀变量传入importre# 提取所有数字格式的价格prices=re.findall(r'\$?\s*([\d,]+\.?\d*)',价格原始)ifprices:# 取第一个匹配的价格clean=prices[0].replace(',','')result=float(clean)else:result=0.0五、TEMU商品详情页采集
列表只拿到基本信息,更多数据需要进详情页:
# TEMU详情页采集——价格+规格+描述点击元素(当前商品)# 进入详情页等待(2秒)# TEMU详情页加载稍慢# 采集详情信息价格=获取元素文本("详情页价格")原标题=获取元素文本("详情页标题")# 规格信息——TEMU规格用的是选择器# 获取所有选中规格的文本规格文本=获取元素文本("规格区域")# 商品描述描述=获取元素文本("商品描述区域")# 采集完关闭详情页(或返回)发送按键("{ESC}")# TEMU详情一般是弹窗,ESC关闭等待(1秒)六、多页翻页与并发控制
# TEMU翻页——URL参数控制当前页码=1最大页数=50# 不要一次采太多条件循环(当前页码<=最大页数):翻页URL="https://www.temu.com/search_result.html?search_key="+关键词_编码+"&page="+ToString(当前页码)打开网页(翻页URL)等待元素出现("商品列表",8秒)采集当前页商品()# 调上面写好的采集子流程当前页码=当前页码+1# 频率控制:TEMU每页至少等5秒等待(5秒)频率控制的经验值
TEMU 对请求频率比国内平台敏感得多:
| 操作 | 建议间隔 |
|---|---|
| 搜索结果翻页 | 5~8 秒 |
| 进入详情页 | 3~5 秒 |
| 详情页内操作 | 2~3 秒 |
| 切换关键词搜索 | 10 秒以上 |
跑太快了容易触发验证码,反而停半天。宁可慢一点,稳定跑完。
七、登录态管理
TEMU 的登录态保持比国内电商短很多。如果你需要做后台数据采集(订单、店铺数据),登录态管理是必须的:
TEMU店群如何管理运营?
# 登录态检测打开网页("https://www.temu.com")等待(3秒)# 判断是否登录的标志判断元素是否存在("用户头像区域")如果 结果为假:# 未登录,执行登录点击元素("登录入口")等待元素出现("登录弹窗",5秒)# TEMU登录支持邮箱和手机点击元素("邮箱登录Tab")输入文本("邮箱输入框","your_email@example.com")输入文本("密码输入框","your_password")点击元素("登录按钮")等待元素出现("用户头像区域",15秒)# 等待登录完成否则:输出日志("已登录,继续执行任务")Cookie 持久化:
在影刀浏览器的设置中开启"记住登录状态",这样不用每次都登录一次。
八、多币种价格统一处理
TEMU 面向全球,不同地区显示不同币种。建议统一转成人民币或美元:
# 多币种转换表(建议一个月更新一次汇率)汇率表={"USD":7.25,# 美元"EUR":7.85,# 欧元"GBP":9.15,# 英镑"JPY":0.048,# 日元"KRW":0.0055,# 韩元}价格识别的时候先判断币种符号,再取对应的汇率换算。
九、完整架构:TEMU竞品监控系统
# 主流程:TEMU竞品价格监控主流程():关键词列表=读取Excel("D:\TEMU数据\竞品关键词.xlsx",Sheet="关键词")# 检查代理检查网络连通行()# 自定义子流程# 检查登录态检查并登录TEMU()遍历列表(关键词列表,当前关键词):# 搜索结果采集采集关键Top100商品()# 对比上一次价格与历史数据对比()# 如果有降价超过10%的商品,记录告警筛选异常降价()# 生成报告生成竞品日报()# 推送飞书发送飞书卡片()十、常见坑与修复速查
| 坑 | 现象 | 修复 |
|---|---|---|
| 代理IP被TEMU拒绝 | 页面打不开或显示异常 | 换住宅IP,降低采集频率 |
| 登录态频繁过期 | 跑几页就登出 | 每次翻页后加判断,自动重新登录 |
| 价格格式不统一 | 采集到的价格无法直接计算 | 用正则统一清洗后再入库 |
| 中文商品名乱码 | 英文系统采集中文 | URL参数加&locale=zh强制中文 |
| 页面加载超时 | TEMU比国内慢 | 等待元素超时设为10~15秒 |
内容标签:#影刀RPA #TEMU自动化 #跨境电商 #数据采集 #RPA实操
作者:林焱
本文为《影刀RPA学习手册》系列文章之一,内容源于实操经验的整理与分享。