煎蛋网怎么看原图(在煎蛋网爬取美女图片)

煎蛋网站

 

很多朋友都反应学 python 语言太枯燥,学不进去,其实学语言最好的方法是自己用所学的语言做项目,在项目中学习语言的用法。今天给大家带来的项目是用 python3 爬取煎蛋网妹子的图片。图片质量还不错,我放两张图片大家感受下。

 

 

这个项目用了 requests + selenium + beautifulsoup 库对网站的图片进行抓取。接下来我就,给大家一步步解析一下,怎么用 python 爬虫爬取图片并下载的。

爬取结果

 

以上就是爬取的结果,通过运行 meizi.py 代码,就可以把图片保存在我指定的目录下,如果没有此目录,就用程序自动创建目录,爬取的所有图片都保存在此目录下。

程序构造

 

程序主要是由 6 个函数组成:

  • get_html() :利用 webdriver 来请求对应的网站。
  • get_page():解析面跳转地址。
  • mkdir():判断目录是否存在,不存在就创建一个。
  • get_pic():提取图片链接。
  • download():通过图片链接下载保存。
  • main():程序执行的主函数。

程序思路

  1. 对目标网站链接进行分析,找出目标网站链接的规律。
  2. 从目标网站里面提取图片链接。
  3. 将图片下载并保存在目录中。

源代码分析

我们通过f12调试页面,看到图片的链接,发现此链接并没有在源代码中,我们推测,图片应该是通过 js 加载的,对于需要 js 才能加载出来的网站,我们就可以利用 selenium 的自动化测试请求库来进行加载。利用 selenium 请求可以模拟真实浏览器访问。

1browser = webdriver.Chrome()

2wait = WebDriverWait(browser, 3)

利用 selenium 请求网页需要下载 chrome 驱动放在 python 安装目录下。

分页链接分析

1def get_page():

2 base_url = 'http://jandan.net/ooxx/' #第一次进入的原始地址

3 soup = BeautifulSoup(get_html(base_url), 'lxml') #解析原始地址

4 current_pages=soup.select('.cp-pagenavi .current-comment-page')[0].get_text()[1:-1] #取出当前页面字段

5 urllist = []

6 for page in range(1,int(current_pages)+1):

7 real_url=base_url+'page-'+str(page)+'#comments' #拼出分页地址

8 urllist.append(real_url)

9 return urllist #返回所有分页地址列表

原始链接 base_url = ‘http://jandan.net/ooxx/’,当我们点击下一页时,发现在原始链接的后面加了一段「page-52#comments」。

其中加的数字,就是表示现在所在的页数,通过 BeautifulSoup 库对页面进行解析,用选择器提取表示页数的字段「current-comment-page」,加入到原始链接中进行拼接。

创建目录

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕!")

用 os.path.exists 方法来个判断,如果不存在此目录就创建一个,如果存在就忽略。

提取图片

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕!")

用 BeautifulSoup 解析源码,用选择器循环提取图片的链接,并调用 download() 函数下载图片直至下载所有图片。

优化改进

本次的程序还有一些不足的地方,比如利用 selenium 库在爬取的时候非常的慢,每页我还设置了 3 秒等待时间,这部分待优化。还有所有页面的图片都保存在一个目录下,没有分开保存,这部分也可以优化。

这波教程不点个关注,说不过去吧?哈哈。这个网站有很多福利,我只能说大家注意身体啊。

本文来自投稿,不代表展天博客立场,如若转载,请注明出处:https://www.me900.com/4642.html

(0)

相关推荐

  • 在家做手工活不交押金(在家做手工活兼职)

    不久发了头条想找个手工活做,好多主动私信我的,包括小红书上也是更多来找我的   我并没有全部回复,也回复不过来,靠缘分吧,随机找了几个聊了聊,所有有押金的我都直接全部ps掉,因为之前了解到这种就是骗押金,无论你怎么做最终都会验货不合格押金也不退。 然而有一个人说是不需要押金的,并且连来回运费都不需要自己出,直接给他地址等待发货就可以,为了让大家看的…

    2021-10-28 用户投稿
  • windowsblinds,windowsblinds密钥

    《关于“windowsblinds”的深入探讨》 一、初识“windowsblinds”也许很多人第一次听到“windowsblinds”这个词时,会感到有些陌生。它到底是什么呢?我觉得它可能是与Windows系统相关的某种工具或软件。就好像我们在使用电脑时,会用到各种不同的软件来满足不同的需求,而“windowsblinds”也许就是其中之一。 从表面上看…

    用户投稿 2025-08-03
  • 京东 苏宁易购,京东苏宁易购哪个正品可靠点

    《京东与苏宁易购:电商巨头的对决与合作》 在当今的电商领域,京东和苏宁易购无疑是两大巨头。 它们各自拥有庞大的用户群体、丰富的商品种类和先进的物流体系,在市场上占据着重要的地位。 那么,京东和苏宁易购到底有哪些特点和优势呢?它们之间又存在着怎样的竞争与合作关系呢?接下来,我们将深入探讨这两个电商平台。 一、京东:品质与服务的代名词 京东以其卓越的品质和优质的…

    用户投稿 2025-05-26
  • 芦荟维他命,芦荟维他片有什么作用

    在还没有护肤概念的时候,妈妈就开始给我用芦荟胶啦,平时被蚊子咬或者不小心撞伤的时候,妈妈都会给我涂上一层厚厚的芦荟胶,防止留疤。陆陆续续用芦荟胶也有不下十种了,毕竟便宜又大碗。但是我看到很多妹子们都知会用芦荟胶直接“涂脸”,这样就发挥不了芦荟胶最大的效果啦。芦荟胶只会“涂脸”?那就太浪费了,带你深扒它的“隐藏”功能!   1、“三明治”美白面膜 首…

    2023-06-26 用户投稿
  • 6个月宝宝食谱,六个半月宝宝辅食食谱

    01 孩子添加辅食有几个原则:从少到多,从一种到多种,从稀到稠,从细到粗。 这样的一个原则,其实也是有时间界限的。 比如说孩子吃米糊或者米粥,这是在孩子刚刚开始从奶过渡到辅食的时候,他的咀嚼能力还不是很强,他的吞咽能力也在学习当中,所以要给孩子一个缓冲的过程。 但是孩子始终要过渡到吃饭菜,但这个缓冲的过程不能太久。 之前我去给妈妈们讲课的时候就碰到一个孩子,…

    2023-06-24
  • 最好的巧克力,最好的巧克力叫什么

    《探寻最好的巧克力:品味与选择的艺术》 巧克力,那是一种仿佛拥有魔法的食物,它能够在舌尖上舞动,唤起无尽的甜蜜与满足。 当我们提及“最好的巧克力”时,这似乎是一个难以确切定义的问题,因为每个人对于巧克力的喜好都有着独特的见解。 也许有人钟爱浓郁醇厚的黑巧克力,那苦涩中夹杂着一丝甜蜜的味道仿佛能直击心灵;也许有人倾心于香甜丝滑的牛奶巧克力,那柔和的口感如同温暖…

    用户投稿 2025-05-07
  • 写网络小说赚钱吗(写文章赚稿费的网站)

    相信各位对看小说这件事并不陌生,但写对小说就不一样了。 大家是否也曾也有过想写小说的念头,但不知在哪写。 其实只要大家细心一点就会发现,无论是网页版还是APP,都会有个作家平台或者是作家助手。 第一个问题 写小说到底赚不赚钱? 那不用说肯定是赚的! 三百六十行,行行出状元嘛。 就像天蚕土豆、唐家三少这种大神光版权收入都过亿了。   但网文圈苦逼千千…

    2021-10-28 用户投稿
  • 生子报喜短信,孩子出生说说报喜短信

    昨天孕妈群里,有一个妈妈生了孩子,结果孩子的爸爸就在群里广发信息说:刘家建设银行于2017年10月13号上午十点八分正式开业了,持有招商银行执照的请马上开始拿号排队,先到先得,走过路过,千万不要错过。 看到这位爸爸报喜的内容,瞬间就被逗笑了,也觉得很有个性,大家也是在群里,祝福声一片片。其实有个性的报喜方式,不光是他们一家,还有更加个性的报喜方式呢,不信都来…

    2023-07-04
  • 社会主义的供养 什么是社会主义的供养

    先申明,在下非公务员,发帖是为了有不同音调。 网上突然冒出很多贴,说什么公务员由纳税人供养,这是典型的照搬非社会主义国家说词。《宪法》规定:我国实行以公有制为主体的社会主义国家。任何纳税人的纳税资金,任何税费,不管资金姓公还是姓私,只要进入国家账户,比如财政部门资金,都属于国家资金(或者公有资金)。 这里指出,有大量的费税等不属于纳税人的纳税资金,比如土地等…

    用户投稿 2023-06-03
  • 电脑租赁app,租电脑什么价格

    电脑租赁价格怎么算?按月租电脑多少钱? 随着科技的飞速发展,电脑在日常生活和工作中扮演着越来越重要。然而购买电脑对于许多人来说可能是一笔不小的开支。因此越来越多的人开始选择租赁电脑,以降低成本并灵活使用。 电脑租赁价格是如何计算的呢?花费多少钱?今天就给大家解答这些问题。 电脑租赁价格的计算因素。电脑租赁价格主要受以下几个因素的影响:电脑的品牌和型号。不同品…

    2023-07-06
  • 知了的营养价值,知了幼虫营养价值

    眼下正是知了上市的旺季,许多市民选择购买食用,专家提醒,知了富有较高的蛋白质,营养价值高,但不宜过量食用,过敏体质人群要慎吃。 市民杨先生的儿子,最近皮肤出现了一些密密麻麻的疙瘩,虽然不是很痒,但看上去很让人揪心。一开始以为是在游泳池游泳时引起的过敏,后来辗转几个诊所后才发现是因为吃了过多的油炸知了造成的过敏。 南阳市第二人民医院营养科主任周玉恺表示,知了具…

    用户投稿 2023-07-06
  • 如何纠缠一个人的心

    有一种爱叫做天长地久。 也有一种爱,叫做爱而不得。 不纠缠 一段感情失败后,不要做舔狗,不要去纠缠,纠缠只会让对方更讨厌你,只会让你更痛苦。 当你发了一大堆信息后,你以为能感动她,其实那只是你以为,而她看到后会很恶心。 纠缠是没有任何意义的,不联系,会慢慢放下,慢慢走出来,重新开始;经常联系,很难放下,时不时的就会想起。 时间和精力,都是有限的,不要浪费,一…

    用户投稿 2023-05-23