零操作,高效下载:利用Playwright和Python完成文件下载_文件名

前言

Playwright 是一个由 Microsoft 开发的跨浏览器自动化测试工具,它提供了强大的功能来模拟用户在浏览器中的操作。Playwright 还可以应用于诸如文件下载等实际场景的测试。本文将介绍如何利用 Playwright 在 Python 中实现文件下载功能。

文件下载

文件下载也是我们进行web自动化测试时经常需要面对的场景,如果我们使用的是selenium,会出现无法处理Windows系统弹出的对话框的情况,需要借助autoit等第三方工具来实现下载功能,playwright则可以不借助其他工具来实现文件自动下载。

playwright提供了expect_download()操作来实现文件的下载操作,当浏览器上下文关闭时,所有属于浏览器上下文的下载文件都会被删除。 下载开始后会发出下载事件。下载完成后,下载路径可用:

with page.expect_download() as download_info:
    page.get_by_text("Download file").click()
download = download_info.value
# wait for download to complete
path = download.path()

相关操作

  1. 取消下载

如果下载已经完成或取消,则不会失败。成功取消后,download.failure()将解析为'canceled'

download.cancel()
  1. .删除下载的文件
download.delete()
  1. 返回下载错误(如果有)
download.failure()
  1. 获取下载所属的页面
download.page
  1. 下载路径

下载成功,则返回下载文件的路径。如有必要,该方法将等待下载完成。该方法在远程连接时抛出。

download.path()

注:下载的文件名是随机 GUID,使用download.suggested_filename获取建议的文件名

  1. 将下载复制到用户指定的路径。在下载仍在进行时调用此方法是安全的。如有必要,将等待下载完成。
download.save_as(path)
  1. 返回此下载的建议文件名
download.suggested_filename

注:通常由浏览器根据Content-Disposition响应标头或download属性计算得出

  1. 返回下载的 url
download.url

实例

我们以下载我们常用的Python单元测试框架pytest为例,使用playwright的代码如下:

from playwright.sync_api import sync_playwright

def run(playwright):
    browser = playwright.chromium.launch(headless=False)
    context = browser.new_context(accept_downloads=True)
    # Open new page
    page = context.new_page()

    page.goto("https://pypi.org/project/pytest/#files")
    #  点击要下载的文件按钮
    with page.expect_download() as download_info:
        page.click("text=pytest-7.3.1.tar.gz")
    download = download_info.value
    path = download.path()
    download.save_as(path)
    # 打印保存路径
    print(path)
    # ---------------------
    context.close()
    browser.close()
with sync_playwright() as playwright:
    run(playwright)

运行脚本,结果如下,我们可以看到,我们正在下载pytest的压缩文件。

零操作,高效下载:利用Playwright和Python完成文件下载_Python_02

总结

使用 Playwright 和 Python,我们可以轻松实现文件下载功能,这对于需要大量下载文件的应用程序来说非常实用。