当前位置:首页 > 使用手册 > 正文内容

【分享】小红书采集图片下载到本地

taoshihan2年前 (2023-10-12)使用手册1466

前面我们把图片链接都存到了excel里,现在想要把图片都下载到本地文件夹

下面是实现的python代码

图片链接存在第三列单元格,并且是多个图片\n分割的,现在把他们全部下载到本地

import pandas as pd
import requests

df = pd.read_excel("小红书.xlsx", header=None)
# 循环遍历每个单元格
for index, row in df.iterrows():
    num = index + 1
    if pd.isna(row[2]):
        continue

    imgs = row[2].split("\n")
    j = 1
    for img in imgs:
        fileName = f"imgs/{num}_{j}.jpg"
        print(fileName)

        # 图像的URL
        image_url = img

        # 发送HTTP请求获取图像
        response = requests.get(image_url)

        if response.status_code == 200:
            # 获取图像的二进制数据
            image_data = response.content

            # 保存图像到本地文件
            with open(fileName, 'wb') as f:
                f.write(image_data)
            print("图像已成功下载到本地。")
        else:
            print("无法下载图像。")
        j += 1





扫描二维码推送至手机访问。

版权声明:本文由智语aichat发布,如需转载请注明出处。

本文链接:http://www.sopans.com/post/64.html

分享给朋友:

“【分享】小红书采集图片下载到本地” 的相关文章

【分享】xpath的属性表达式

在XPath中,要选择HTML文档中具有特定类的元素,您通常需要使用属性选择器 [@attribute-name='attribute-value'] 来选择元素,其中 attribute-name 是属性名称,attribute-value 是要匹配的属性值。对于HTML元素的类选择器,您可以使用...

【分享】xpath的路径表达式

XPath(XML Path Language)是一种用于在XML文档中定位和选择元素的查询语言。XPath使用路径表达式来描述文档中的元素位置和关系。下面是XPath中常用的路径表达式的一些示例:选择根元素:要选择文档的根元素,可以使用斜杠(/)。/选择所有子元素:要选择某个元素的所有子元素,可...

【分享】影刀使用xpath捕获指定的元素

【分享】影刀使用xpath捕获指定的元素

xpath捕获元素比较精准,前面也介绍了xpath的用法现在捕获社区里帖子详情页的标题//*[@class='discuss_detail_header___3LhnQ']/h1找到class是discuss_detail_header___3LhnQ的子元素h1获取文章内容//*[@id=...

【分享】小红书数据采集入excel表格

【分享】小红书数据采集入excel表格

思路:1. 打开小红书关键词页面2. 循环指定次数,并鼠标往下滚3. 获取元素列表,循环元素列表4. 判断标题是否在list中,如果在就跳过,如果不在将标题存入list中5. 点击元素,读取标题和内容,存入excel,按ESC键...

RPA软件

三个编辑器各有优缺点但是对于个人来说三个软件可以起到互补互助的作用只要流程和思路正确提前适应编辑器的特点,这个很重要。(适应就会改变我们的一些习惯)三个RPA软件都可以帮你实现...

学习RPA两年了,我得到了什么?

学习RPA两年了,我得到了什么?

两年前,由于工作上的需要,我开始接触RPA(Robotic Process Automation)技术。作为一种新兴的科技工具,RPA的自学为我带来了许多好处和满足感。过程:1⃣️.学习RPA:学习的软件是影刀,其实学影刀还挺方便的,软件上配套的课程就有完整的,不用自己去找,大概学了2周,就把初级课...