python 读取桌面图标 python桌面图片

转载

mob64ca140b0bc8 2024-04-26 12:11:37

文章标签 python 读取桌面图标 html 数据 python 文章分类 Python 后端开发

Python cosplay壁纸图片下载(大家都懂的)

环境配置

Pycharm开发环境 
python 版本 python3.7
Anconda 集成开发环境

爬虫的一般思路主要流程步骤

#### 1、分析目标网页，确定爬取的url路径，headers参数
#### 2、发送请求--requests 模拟浏览器发送请求，获取响应数据
#### 3、解析数据parsel转化为Selector对象，Selector对象 具有xpath的方法，能够对转化的数据进行处理
#### 4、保存数据--保存在目标文件夹中

环境配置

Pycharm开发环境 
python 版本 python3.7
Anconda 集成开发环境

导入第三方模块

pip install requests
	pip install parsel

网页分析

爬取网站美桌壁纸http://www.win4000.com/

python 读取桌面图标 python桌面图片_python 读取桌面图标

爬取cosply壁纸（好东西，大家都懂得）

python 读取桌面图标 python桌面图片_python 读取桌面图标_02

网页链接相册的链接地址分析

python 读取桌面图标 python桌面图片_python 读取桌面图标_03

html_data= parsel.Selector(data_text)
data_list = html_data.xpath('//div[@class="Left_bar"]//ul/li/a/@href').extract()
print(data_list)

# 获取标签 '//'  从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置。
div 标签 使用@方法获取class 属性
ul/li/ 获取地址一步一步到了li标签下面
li 标签下面有a标签，标签下面有href属性，href属性里面有一些资源

详情页面图片资源获取

python 读取桌面图标 python桌面图片_html_04

# 详情页面数据解析
# img_url = response_2_data.xpath('//div[@class="pic-meinv"]/a/img/@data-original').extract_first()
# 获取标签 '//'  从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置。
div 标签 使用@方法获取class 属性 pic-meinv
标签下面有a标签，标签下面有img属性，@data-original属性里面有一些图片地址链接资源

代码分析

#-*- codeing = utf-8 -*-
#@Time : 2020/5/26 20:17
#@Author : dele
#@File : cosplay.py
#@Software: PyCharm

#爬虫的般思路
#1、分析目标网页。确定爬取的ur1路径，headers参数
#2、发送请求--requests 模拟浏览器发送请求，获取响应数据
#3、解析数据--parsel转化为Selector对象，Selector对象 具有xpath的方法，能够对转化的数据进行处理
#4、保存数据


# cosplay 静态网页 数据获取 基本方法


# 模块导入
import  requests
import  parsel
import  os

# 目标网页分析

base_url = 'http://www.win4000.com/meinvtag26.html'

headers ={
'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36'
}
# 发送请求--requests 模拟浏览器发送请求，获取响应数据
response = requests.get(url=base_url,headers= headers)
response.encoding = response.apparent_encoding # 自动识别编码格式  “charset=utf-8"  ”utf-8“
data_text = response.text

# print(data_text) #打印网页源代码

html_data= parsel.Selector(data_text)
data_list = html_data.xpath('//div[@class="Left_bar"]//ul/li/a/@href').extract()
print(data_list)

for alllist in data_list:
    response_2 =requests.get(url=alllist,headers=headers).text
    response_2_data = parsel.Selector(response_2)
    img_url = response_2_data.xpath('//div[@class="pic-meinv"]/a/img/@data-original').extract_first()

    print(img_url)


    img_url_data = requests.get(url=img_url,headers=headers).content

    file_name = img_url.split('/')[-1]

    with open('cosplay_img\\'+file_name,mode='wb') as f:
        print('正在保存图片：',file_name)
        f.write(img_url_data)

效果

python 读取桌面图标 python桌面图片_python_05

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：局域网内 centos 无法打开主机端口怎么办 centos局域网共享

下一篇：whl 仓库如何使用仓库window

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

python 读取桌面图标 python桌面图片

python 读取桌面图标 python桌面图片

Python cosplay壁纸图片下载(大家都懂的)

环境配置

爬虫的一般思路 主要流程步骤

环境配置

导入第三方模块

网页分析

爬取网站美桌壁纸http://www.win4000.com/

爬取cosply壁纸（好东西，大家都懂得）

网页链接相册的链接地址分析

详情页面图片资源获取

代码分析

效果

51CTO博客

爬虫的一般思路主要流程步骤