news 2026/6/15 14:25:54

在Trae上使用Bright Data MCP采集数据

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
在Trae上使用Bright Data MCP采集数据

不知道你发现没,由于现在ChatGPT、DeepSeek、Gemini、豆包等AI大模型的兴起,大家的搜索习惯发生了很大变化,传统的谷歌、百度、必应搜索像是老古董,已经没法满足用户对信息准确性、及时性、高质量的要求了,甚至懒得点开一个个网页去找答案。

其实网页爬虫也一样,爬虫说到底就是收集数据,和你平时浏览网页没区别,只不过是用脚本批量化的去采集数据,AI大模型的出现让爬虫也开始进化,传统的Python爬虫、软件爬虫在慢慢被AI爬虫取代,比如说我常用的一个数据采集MCP-Bright Data MCP,能通过Trae这样的Agent调用,直接用自然语言就可以采集目标网站的数据,完全不用写代码,甚至你都不用打开目标网站。

最近刚好苹果发布新iPhone,我用Bright Data MCP获取最新的iPhone 17价格信息,能实时采集且不需要我处理任何网站限制的问题,我把采集来的信息写成了一个可视化看板,用来实时监测价格信息。

当然这只是自娱自乐的玩意,且是小批量采集公开数据,要遵守网站规定噢。

在这里插入图片描述

以上做的事情分为三个步骤,第一是在Trae上配置Bright Data MCP服务,第二是搭建智能体,给到数据采集需求,第三是将反馈的数据开发成可视化看板,咱们会详细讲解每个步骤实现过程。

一、在Trae上配置Bright Data MCP服务

首先要介绍下什么是MCP,它的学名是“模型上下文协议”,你可以理解成它是连接AI大模型和外部工具的一个媒介,类似于电脑和互联网的关系,大模型原先只是封闭的大脑,有了MCP后它就连接了无数的信息、工具、数据,可以做更多的事情,比如Bright Data MCP能实现复杂网站的数据采集。

讲到Bright Data MCP,它是亮数据开发的一款专门用于网络数据采集、搜索的MCP服务,可以最大的特点是可以自动处理各种网站的反爬机制,不需要你考虑什么IP识别、人机检测等技术细节,把爬虫所有能遇到的封禁问题都在后台解决了,你只需要专注于提问聊天就行。

亮数据会送新用户3个月免费额度,每个月5000次MCP请求,完全够用了。

https://get.brightdata.com/wmcp

Bright Data MCP能在Trae、Cluade Code、Cursor等Agent中部署,以Trae为例,主要分为3个步骤。

1、注册亮数据账号,获取MCP API key

你可以直接去亮数据网站注册,注册好后在账户设置-用户管理界面生成专用API key。

https://get.brightdata.com/wmcp

2、获取MCP服务信息

同样在亮数据后台,有个MCP功能区,里面提供了本地和远程两种MCP模式,建议用本地MCP,自己搭建也不复杂,而且相对灵活。

复制上面的MCP配置信息,以及之前申请的Key,留着备用。

这里讲下Bright Data MCP的4个核心组件,分别是search_engine用于搜索引擎抓取、web_scraper用于处理反爬机制、search_engine_batch用于批量搜索引擎抓取、scrape_batch用于批量网页抓取,它们相互配合能采集非常复杂的网页数据。

3、在Trae中配置MCP

Trae是近一年比较流行的AI编辑器,字节开发的产品,类似于VsCode,但Trae有更强的AI编程能力,比如搭建智能体、布置MCP等。

在Trae的AI功能管理中选择手工添加MCP,开始配置信息。

接下来,在配置框里粘贴刚刚在亮数据后台复制的MCP配置信息。

补充一点,配置MCP需要电脑安装Node.js,如果没安装Trae会提醒你安装,直接同意即可。

接下来你就会在MCP界面看到配置好的Bright Data MCP。

MCP服务需要在智能体中使用,接下来我在Trae中创建一个名为“EasySearch”的智能体,并勾选Bright Data MCP服务,还要注意设置初始提示词,告诉智能体它是干什么的,需要在提示语里告诉它用Bright Data MCP。

在这里插入图片描述

到这一步,你就可以用Bright Data MCP来采集数据了。

打开Trae AI对话框,选择刚创建的“EasySearch”智能体,直接问它:

请你梳理美国amazon、苹果官网上iphone17全系列最新价格、配置信息、链接、日期, 以列表形式输出,呈现各平台的对比

该智能体就会自动调用Bright Data MCP服务,去采集网站上iPhone17的价格信息。

最后你会得到结构化的Excel数据,清晰明了。

针对该数据,你还可以让Trae开发一个可视化看板,用于展示。

除了Trae,一些Vscode插件也支持部署Bright Data MCP服务,比如Cline,直接设置远程MCP服务,非常简单。

在亮数据后台复制远程MCP配置信息。

在Cline 远程MCP配置界面粘贴Bright Data MCP配置信息。

提问Cline,它会自动调用Bright Data MCP来采集数据。

总的来说,AI爬虫已经成为不可逆的趋势,完全不需要写代码处理网页,几乎零门槛,而且能很好的和一些智能体结合,做出不错的产品,比如手机的价格监测应用,运营的好也能带来不错的效果。

你可以拿Bright Data MCP练练手,刚好亮数据会送新用户3个月免费额度,每个月5000次MCP请求,足够开发一个小应用了。

https://get.brightdata.com/wmcp

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 1:36:54

饿了吗Java面试被问:Service Mesh的数据平面和控制平面

一、核心概念总览 Service Mesh(服务网格)是一种基础设施层,它处理服务间通信,提供负载均衡、服务发现、流量管理、安全、可观测性等能力,而无需修改应用代码。 双平面架构 text 复制 下载 ┌──────────…

作者头像 李华
网站建设 2026/6/14 0:54:40

埋点埋成“数据垃圾场”?设计一套“能下线的埋点规范”有多重要

摘要:在互联网产品的快速迭代中,我们往往只顾着“加埋点”,却从未想过“减埋点”。几年下来,数据仓库里堆积了成千上万个无人认领的事件,分析师不敢用,开发不敢删。本文将探讨如何从规范层面引入“埋点生命…

作者头像 李华
网站建设 2026/6/9 22:44:05

手机蓝牙操控LED屏:零基础入门必看指南

以下是对您提供的博文内容进行 深度润色与专业重构后的版本 。我以一位深耕嵌入式系统多年、同时活跃于开源硬件社区的工程师视角,彻底重写了全文: - 去除所有AI腔调与模板化表达 (如“本文将从……几个方面阐述”、“综上所述”等&…

作者头像 李华
网站建设 2026/6/12 5:37:41

cv_unet_image-matting如何评估抠图质量?PSNR/SSIM指标计算教程

cv_unet_image-matting如何评估抠图质量?PSNR/SSIM指标计算教程 1. 为什么抠图质量评估不能只靠“眼睛看”? 你可能已经用过 cv_unet_image-matting 的 WebUI,上传一张人像,点几下就得到干净的透明背景图——效果看起来不错。但…

作者头像 李华
网站建设 2026/5/29 20:14:06

告别繁琐配置!用cv_resnet18_ocr-detection快速搭建OCR系统

告别繁琐配置!用cv_resnet18_ocr-detection快速搭建OCR系统 你是否还在为部署OCR系统而头疼?下载模型、编译环境、写推理脚本、调试依赖……一套流程走下来,半天时间没了,结果还可能卡在CUDA版本不匹配或OpenCV编译失败上。更别说…

作者头像 李华
网站建设 2026/6/14 23:31:05

Qwen-Image-2512支持中英文混合提示词?实测可行!

Qwen-Image-2512支持中英文混合提示词?实测可行! 本文由 源码七号站 原创整理,转载请注明出处。如果你曾为AI绘图中“中文描述不精准、英文术语又难组织”而反复修改提示词;如果你试过把“赛博朋克风的上海外滩夜景,霓…

作者头像 李华