当前位置:首页 > 使用手册 > 正文内容

【分享】小红书采集图片下载到本地

taoshihan2年前 (2023-10-12)使用手册878

前面我们把图片链接都存到了excel里,现在想要把图片都下载到本地文件夹

下面是实现的python代码

图片链接存在第三列单元格,并且是多个图片\n分割的,现在把他们全部下载到本地

import pandas as pd
import requests

df = pd.read_excel("小红书.xlsx", header=None)
# 循环遍历每个单元格
for index, row in df.iterrows():
    num = index + 1
    if pd.isna(row[2]):
        continue

    imgs = row[2].split("\n")
    j = 1
    for img in imgs:
        fileName = f"imgs/{num}_{j}.jpg"
        print(fileName)

        # 图像的URL
        image_url = img

        # 发送HTTP请求获取图像
        response = requests.get(image_url)

        if response.status_code == 200:
            # 获取图像的二进制数据
            image_data = response.content

            # 保存图像到本地文件
            with open(fileName, 'wb') as f:
                f.write(image_data)
            print("图像已成功下载到本地。")
        else:
            print("无法下载图像。")
        j += 1





扫描二维码推送至手机访问。

版权声明:本文由智语aichat发布,如需转载请注明出处。

本文链接:https://www.sopans.com/post/64.html

分享给朋友:

“【分享】小红书采集图片下载到本地” 的相关文章

第零步:智能客服系统简介

项目简介智能客服系统是基于Golang语言自主开发的在线客服系统(以下简称客服系统)。创立于2019年初,是一款连接企业与客户的即时通讯项目,遵循快速、简洁的开发原则,是为中小企业量身定制的全渠道客服系统,致力于帮助广大开发者/公司快速部署整合私有化独立客服功能。客服系统的部署模式为私有化独立部署,...

第零步:知识库AI客服助理概述

我们都使用过ChatGPT,也能感受得到其他大模型LLM的能力。但是,LLM并不能知道我们企业或个人的私有知识信息。现在,我们基于ChatGPT和私有数据构建智能知识库,智能辅助客服回复用户消息。可以做到全自动回复,或者辅助客服人工回复。ChatGPT+企业私有专属数据=智能客服助理。简单几步,立马...

LookHandles.exe软件多开窗口修改标题

LookHandles.exe软件多开窗口修改标题

当我们针对某个软件进行多开以后,比如我们多开了电脑版微信。此时,使用UI自动化工具是无法准确确定窗口的,因为窗口的名称和类名都一样我们可以使用LookHandles.exe修改窗口名称修改窗口名称LookHandles.exe使用方法LookHandles.exe点住放大镜,移动到想要修改的窗口上,...

【分享】获取微信通讯录python代码形式实现

【分享】获取微信通讯录python代码形式实现

具体流程就是:1. 打开微信 2. 点击通讯录3. 滚动鼠标到最顶部(防止已经滚动了一部分了)4. 获取联系人列表5. 找到最后一个空格所在的位置(后一个就是真正的联系人了)6. 点击第一个联系人7.记录下上一个联系人的微信号7. 无限循环按键盘下箭头当前微信号与上一个相同的时候,说明到底部了,可以...

【分享】xpath的属性表达式

在XPath中,要选择HTML文档中具有特定类的元素,您通常需要使用属性选择器 [@attribute-name='attribute-value'] 来选择元素,其中 attribute-name 是属性名称,attribute-value 是要匹配的属性值。对于HTML元素的类选择器,您可以使用...

【分享】影刀使用xpath捕获指定的元素

【分享】影刀使用xpath捕获指定的元素

xpath捕获元素比较精准,前面也介绍了xpath的用法现在捕获社区里帖子详情页的标题//*[@class='discuss_detail_header___3LhnQ']/h1找到class是discuss_detail_header___3LhnQ的子元素h1获取文章内容//*[@id=...