news 2026/6/8 3:38:50

python爬取简书首页前10文章

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
python爬取简书首页前10文章

爬虫代码——爬取简书首页前10文章

frombs4importBeautifulSoupfromurllib.requestimporturlopen,Request# 配置 User-Agent 并创建 Request 对象headers={'User-Agent':'Mozilla/5.0 (X11; Linux x86_64; rv:68.0) Gecko/20100101 Firefox/68.0'}req=Request(url='https://www.jianshu.com/',headers=headers)# 爬取网页bs=BeautifulSoup(urlopen(req).read(),'html.parser')all_article=bs.find_all('a',{'class':'title','target':'_blank'})# 显示数据forarticleinall_article:print('=====文章=====')print('标题:{}'.format(article.get_text()))print('链接: {}'.format('https://www.jianshu.com'+article.attrs['href']))print(article.parent.p.get_text()[7:])# 每个描述字符串前都有 7 个空 格,需要截断print('============\n')
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/7 13:14:27

关于机器那些事儿

前言机器这个概念,在监控系统里具有比较特殊的场景。核心是因为两个原因:机器上面的服务有时会混部,导致机器和业务程序之间的对应关系不好搞(这就是对待机器不能像对待 Pod 的原因)采集器 agent 通常部署在机器上&…

作者头像 李华
网站建设 2026/6/6 9:59:47

基于Java Swing的猜数字小游戏(1)

1、项目介绍 猜数字小游戏是一款基于Java Swing开发的GUI桌面应用程序,兼容JDK 8及以上版本。该游戏核心玩法为系统随机生成指定范围的整数,用户通过输入数字进行猜测,系统根据用户输入给出“猜大了”“猜小了”的提示,直到用户猜…

作者头像 李华
网站建设 2026/6/3 19:44:35

快速上手Gemini API项目教程:5分钟搞定Python异步AI开发

快速上手Gemini API项目教程:5分钟搞定Python异步AI开发 【免费下载链接】Gemini-API ✨ An elegant async Python wrapper for Google Gemini web app 项目地址: https://gitcode.com/gh_mirrors/gem/Gemini-API 想要快速上手Google Gemini API项目开发吗&a…

作者头像 李华