Amazon S3
简单持久、可大规模扩展的对象存储
诞生于2006年3月14日的 π Day, 对象存储服务 Amazon S3 作为亚马逊云科技第一款面向公众服务的云计算产品,15 年来以持续领先业界的可扩展性、高可用性、安全性和持久性,为全球各地的公司存储数百万个应用程序的数据。
新用户注册可享受 12 个月 Amazon S3 免费套餐, 每月免费使用 5GB 标准存储,。
Amazon Simple Storage Service (Amazon S3) 是一种对象存储服务,可提供业界领先的可扩展性、数据可用性、安全性和性能。这意味着各种规模和行业的客户都可以使用它来存储和保护各种使用案例(例如数据湖、网站、移动应用程序、备份和还原、存档、企业级应用程序、IoT 设备和大数据分析)的任意量的数据。Amazon S3 提供易于使用的管理功能,以便您可以组织数据并配置经过微调的访问控制,以满足您的特定业务、组织和合规性要求。Amazon S3 设计具有 99.999999999% (11 个 9) 的持久性,并为全球各地的公司存储数百万个应用程序的数据。
优势
Amazon S3 具有基于 Web 的管理控制台和移动应用程序,非常易于使用,并且提供全套 REST API 和软件开发工具包,可与第三方技术轻松集成。
简单
Amazon S3 具有基于 Web 的管理控制台和移动应用程序,非常简单易用。S3 还提供全套 REST API 和软件开发工具包,可与第三方技术轻松集成。
高持久性
Amazon S3 提供持久的基础设施存储重要数据,其设计旨在为对象提供 99.999999999% 的持久性。您的数据将通过冗余方式存储在多个设施以及一个设施内的多个设备上。
可扩展
利用 Amazon S3,您可以尽可能多地存储数据并在需要时访问数据。您可以不必预测未来的存储需求并可根据需要进行扩展与缩减,从而大幅提高业务灵活性。
安全
Amazon S3 支持通过安全通道进行数据传输,并在数据上传完成时会自动保护数据。您还可以配置存储桶策略来使用 Amazon Identity and Access Management (IAM) 管理对象权限并控制对数据的访问。
可用性高
Amazon S3 标准可在指定年度内为对象提供高达 99.99% 的可用性,并且以 Amazon S3 服务等级协议作为后盾,可满足您的需求并且值得信赖。您还可以选择一个 亚马逊云科技 区域来优化延迟、尽可能降低成本或满足法规要求。
成本低廉
在 S3 存储类中存储数据可节省成本,性能不会受到丝毫影响,S3 存储类可以相应的速率支持不同的数据访问级别。您可以使用 S3 存储类分析来发现应基于访问模式迁移到成本较低的存储类的数据,并配置 S3 生命周期策略以执行数据传输。您还可以使用 S3 智能分层(其可以基于不断变化的访问模式为对象进行分层,并自动节省成本)中不断变化或未知的访问模式来存储数据。
集成化
Amazon S3 与其他 亚马逊云科技 服务深度集成,因此客户可以轻松构建使用各种 亚马逊云科技 服务的解决方案。集成的服务包括 [Amazon CloudFront]、[Amazon CloudWatch]、[Amazon Kinesis]、[Amazon RDS]、[Amazon Glacier]、[Amazon EBS]、[Amazon DynamoDB]、[Amazon Redshift]、[Amazon EMR]和 [Amazon VPC]。
轻松管理数据和访问控制
S3 为您提供强大的功能来管理访问、成本、复制和数据保护。通过 S3 接入点,您可以使用共享数据集为应用程序轻松管理具有特定权限的数据访问。S3 复制管理区域内或到其他区域的数据复制。S3 批量操作可帮助管理数十亿对象的大规模变更。由于 S3 可与 Amazon Lambda 配合使用,因此您无需管理其他基础设施即可记录活动、定义提醒和实现工作流程自动化。
就地查询
只有 亚马逊云科技 提供 Amazon S3 Select,这是一种从 S3 对象中仅检索所需数据的子集的方法,可将大多数经常从 S3 访问数据的应用程序的性能最多提高 400%。
使用案例
数据湖
Amazon S3 为各种内容(从 Web 应用程序到媒体文件)提供一种高持久性和高可用性存储。它允许您将整个存储基础设施转移到云端,从而利用 Amazon S3 的可扩展性和按需付费的优势,以处理不断增长的存储需求。您可以从 Amazon S3 直接分发您的内容。
对于分享易于复制的内容或在其他位置存储了原始副本的内容,Amazon S3 的标准 - 不频繁访问存储 (S-IA) 功能提供了一种具有吸引力的解决方案。例如,如果您想将媒体内容存储在内部,但需要向客户、渠道合作伙伴或员工提供访问权限,则可以使用 S-IA 这一低成本解决方案来存储和分享此内容。
内容存储和分发
Amazon S3 为各种内容(从 Web 应用程序到媒体文件)提供一种高持久性和高可用性存储。它允许您将整个存储基础设施转移到云端,从而利用 Amazon S3 的可扩展性和按需付费的优势,以处理不断增长的存储需求。您可以从 Amazon S3 直接分发您的内容。
对于分享易于复制的内容或在其他位置存储了原始副本的内容,Amazon S3 的标准 - 不频繁访问存储 (S-IA) 功能提供了一种具有吸引力的解决方案。例如,如果您想将媒体内容存储在内部,但需要向客户、渠道合作伙伴或员工提供访问权限,则可以使用 S-IA 这一低成本解决方案来存储和分享此内容。
用于数据分析的存储
无论是存储用于分析的医药数据、用于计算和定价的财务数据,还是用于调整尺寸的照片图像,Amazon S3 都是存储原始内容的理想位置。这样,您可以将该内容发送到 Amazon EC2 进行计算、调整大小或其他大规模分析,而不会由于在这些服务之间移动数据产生任何数据传输的费用。然后,您可以选择使用 Amazon S3 的降低的冗余存储功能(当然,也可以使用 Amazon S3 的标准存储)来存储这些结果以及可复现的内容。
备份、存档与灾难恢复
Amazon S3 提供了高持久性、高可扩展性以及安全的解决方案来备份和存档您的关键数据。您可以使用 Amazon S3 的版本控制功能为存储的数据提供进一步的保护。您也可以基于对象的生命周期定义存档规则,将 Amazon S3 对象集存档到 Amazon S3 Glacier 和 Amazon S3 Glacier Deep Archive,以享受极低成本的存储服务。随着数据老化,这些规则可以确保您的数据自动存储到最合算的存储服务中。
静态网站托管
您可以在 Amazon S3 上托管整个静态网站,进而获得一个价格实惠、高度可用并且可根据流量要求自动扩展的托管解决方案。自托管一个可以处理峰值流量加载且高度可用的网站不但非常困难,而且成本高昂。有了 Amazon S3,您可以提供可靠的流量服务,并且无需再为处理突发的高峰流量而扩展基础设施问题大伤脑筋。Amazon S3 设计保证了 99.99% 的可用性和 99.999999999% 的持久性,它使得您能够访问一个可高度扩展且快速可靠的基础设施,也就是 Amazon 运行自身的全球网站网络所采用的基础设施。您还可以享受到按需付费的定价,也就是只按实际用量付费。Amazon S3 的网站托管解决方案特别适合托管静态内容(包括 html 文件、图片、视频以及 JavaScript 等客户端脚本)的网站。(建议使用 Amazon EC2 进行托管包含服务器端脚本编写和数据库交互内容的网站。)
混合云存储
使用 [Amazon PrivateLink] 在 Amazon S3 和本地之间设置私有连接。您可以在 VPC 中预置私有终端节点,以允许使用私有 IP 从本地直接访问 S3。Amazon Storage Gateway 让您可以无缝连接本地应用程序并将其扩展到 Amazon Storage,同时在本地缓存数据以实现低延迟访问。
了解有关 Amazon S3 的更多信息
Amazon S3 功能
Amazon S3 具有各种各样的功能,您可以使用这些功能以特定的方式组织和管理数据,从而支持具体使用案例、实现成本效益、增强安全性并满足合规性要求。Amazon S3 将数据作为对象存储在被称为“存储桶”的资源中,单一对象大小最多可为 5TB。S3 功能包括将元数据标签附加到对象、跨 S3 存储类移动和存储数据、配置和实施数据访问控制、保护数据免受未经授权的用户访问、运行大数据分析以及在对象级别和存储桶级别监控数据的能力。可以通过 S3 接入点或直接通过存储桶主机名访问对象。
- 每个对象存储在存储桶中,并可通过开发人员分配的唯一密钥进行检索。
- 在某一特定区域存储的对象将一直留在该区域,除非您将其传出。
- 身份验证机制旨在确保数据安全,以防未授权访问。对象可以设置为私有或公有,也可以向特定用户授予权限。
- 使用基于标准的 REST 和 SOAP 接口,它们可与任何互联网开发工具包搭配使用。
- 灵活构建,以便能够轻松添加协议或功能层。默认下载协议为 HTTP,而且 S3 API 也支持 HTTPS。AWS CLI 和 SDK 默认使用安全 HTTPS 连接。
- 提供功能,以简化整个生命周期中的数据可管理性。包括用于按存储桶分隔数据、监视和控制花费,以及自动将数据存档至成本更低存储的选项。这些选项均可通过 [Amazon S3 管理控制台]轻松进行管理。
保护您的数据
默认情况下,Amazon S3 中存储的数据是安全的;只有存储桶和对象所有者才能访问他们所创建的 Amazon S3 资源。Amazon S3 支持多种访问控制机制。借助 Amazon S3 的数据保护功能,您可以保护数据免受逻辑和物理故障的影响,防止因用户意外操作、应用程序错误及基础设施故障而导致数据丢失。对于必须遵守相关法规标准的客户,Amazon S3 的数据保护功能可作为实现合规性的总体策略的一部分。下面将详细介绍 Amazon S3 提供的各种数据安全和可靠性功能。
Amazon S3 提供灵活的安全性功能,以防未经授权的用户访问您的数据。使用网关 VPC 终端节点和接口 VPC 终端节点从您的 Amazon Virtual Private Cloud (Amazon VPC) 和本地连接到 S3 资源。Amazon S3 支持在数据上传时应用服务器端加密(使用三种密钥管理选项)和客户端加密。使用 S3 清单可检查 S3 对象的加密状态。
审核日志
Amazon S3 还支持记录对 Amazon S3 资源发出的请求。您还可以配置 Amazon S3 存储桶,针对发出的相关请求创建访问日志记录。这些服务器访问日志可捕获对存储桶或其中的对象发出的所有请求,还可用于审核目的。
版本控制
Amazon S3 通过版本控制功能提供了进一步的保护。您可以使用版本控制保留、检索和恢复存储在 Amazon S3 存储桶中的每个对象的每个版本。这使您能够从用户意外操作和应用程序故障中轻松恢复。默认情况下,请求将会检索最新写入的版本。通过在请求中指定版本,可以检索对象的较旧版本。存储费率适用于存储的每个版本。您可以配置生命周期规则,以自动控制生命周期和存储多个版本的成本。
数据安全性的详细信息
Amazon S3 支持多种机制,使您能够灵活控制访问您数据的人员,以及他们的访问方式、时间和位置。Amazon S3 提供了四种不同的访问控制机制:Identity and Access Management (IAM) 策略、访问控制列表 (ACL)、存储桶策略以及查询字符串身份验证。IAM 让拥有多名员工的组织能够使用一个 AWS 账户创建和管理多个用户。通过 IAM 策略,您可以授予 IAM 用户对 Amazon S3 存储桶或对象的细化控制权。您可以使用 ACL 选择性地添加(授予)对个别对象的特定权限。Amazon S3 存储桶策略可用来添加或拒绝对单一存储桶内的部分或所有对象的权限。使用查询字符串身份验证,您能够通过仅在预定时间段内有效的 URL 共享 Amazon S3 对象。
您可以使用 HTTPS 协议通过 SSL 终端节点,将数据安全地上传/下载到 Amazon S3。
Amazon S3 还支持记录对 Amazon S3 资源发出的请求。您还可以配置 Amazon S3 存储桶,针对发出的相关请求创建访问日志记录。这些服务器访问日志可捕获对存储桶或其中的对象发出的所有请求,还可用于审核目的。
适用于 Amazon S3 的 AWS PrivateLink
适用于 S3 的 AWS PrivateLink 提供 Amazon S3 和本地之间的私有连接。您可以在 VPC 中为 S3 预置接口 VPC 终端节点,以便通过 AWS Direct Connect 将本地应用程序直接连接到 S3。连接 S3 VPC 终端节点的请求将通过 AWS 中国网络自动路由到 S3。您可以为接口 VPC 终端节点设置安全组并配置 VPC 终端节点策略,以增强访问控制。
数据持久性和可靠性
Amazon S3 为任务关键型和主要数据存储提供了高持久性存储基础设施。Amazon S3 通过冗余方式将数据存储在多个设施中以及每个设施内的多个设备上。为了提高持久性,Amazon S3 在确认数据已成功存储之前会将数据同步存储在多个设施中。此外,Amazon S3 还会在存储或检索数据时,对所有网络流量计算校验和,以检测数据包是否损坏。与需要进行费时耗力的数据验证和手工修复的传统系统不同,Amazon S3 可以定期执行系统的数据完整性校验,并且内置了自动的自我修复功能。
标准具有以下特点:
- 以 Amazon S3 服务等级协议作为后盾,以确保可用性。
- 设计旨在特定年度内实现对象 99.999999999% 的持久性和 99.99% 的可用性。
- 能够承受同时两个设施中的数据丢失。
标准 – 不频繁访问具有以下特点:
- 以 Amazon S3 服务等级协议作为后盾,以确保可用性。
- 设计旨在特定年度内实现对象 99.999999999% 的持久性和 99.9% 的可用性。
- 能够承受同时两个设施中的数据丢失。
Amazon S3 Glacier 具有以下特点:
- 设计旨在特定年度内实现对象 99.999999999% 的持久性。
- 能够承受同时两个设施中的数据丢失。
- 检索时间可以配置为数分钟到数小时不等
Amazon S3 Glacier Deep Archive 具有以下特点:
- 设计旨在可跨多个可用区实现对象 99.999999999% 的持久性
- 成本最低的存储类旨在实现将保留 7-10 年的数据的长期保留
- 磁带库的理想替代品
- 检索时间在 12 小时内
Amazon S3 智能分层具有以下特点:
- 设计旨在可跨多个可用区实现对象 99.999999999% 的持久性
- 设计在指定年度内实现 99.9% 的可用性
- 通过更改访问模式自动优化数据的存储成本
- 将对象存储在四个访问层中,针对频繁访问、不频繁访问和罕见访问进行了优化
- 频繁访问层和不频繁访问层具有与 S3 标准相同的低延迟和高吞吐量性能
- 为很少访问的对象激活可选的自动存档功能
- 存档访问层和深度存档访问层具有与 Glacier 和 Glacier Deep Archive 相同的性能
- 只需少量月度监控和自动分层费用
存储管理
Amazon S3 让您能够轻松管理数据,方法是向您直观显示数据使用模式并提供工具来通过管理策略管理存储。所有这些管理功能都可以使用 Amazon S3 API 或管理控制台轻松管理。下面将详细介绍 Amazon S3 提供的各种数据管理功能。
S3 对象标记
借助 Amazon S3 对象标记,您可以管理并控制对 Amazon S3 对象的访问。S3 对象标签是适用于 S3 对象的键值对,在对象的生命周期内,可随时创建、更新或删除这些标签。借助这些标签,您将能够创建 Identity and Access Management (IAM) 策略,设置 S3 生命周期策略以及自定义存储指标。然后,这些对象级标签可以管理在存储类之间的转换并在后台让对象过期。
S3 清单
您可以使用 S3 清单简化并加快业务工作流程和大数据作业,这可以有计划地取代 Amazon S3 的同步列表 API。S3 清单提供对象的 CSV(逗号分隔值)平面文件输出,以及它们 S3 存储桶或共享前缀每天或每周的对应元数据。
存储类分析
借助存储类分析,您可以监控 S3 存储桶中对象的访问频率,以便将访问频率较低的存储转换到成本较低的存储类。存储类分析会观察使用模式以检测访问频率较低的存储,这有助于您将相应的对象转移到 S3 标准 – IA、S3 单区 –IA、Amazon S3 Glacier 和 Amazon S3 Glacier Deep Archive。您可以配置存储类分析策略来监控整个存储桶、前缀或对象标签。在存储类分析检测到应转移到 S3 标准 – IA、S3 单区 –IA、Amazon S3 Glacier 或 Amazon S3 Glacier Deep Archive 的数据后,您可以基于这些结果轻松创建新的生命周期策略。此外,该功能每天还会在指定的存储桶、前缀或标签级别详细分析存储使用情况,您可以将分析结果导出到 S3 存储桶。
S3 CloudWatch 指标
Amazon S3 CloudWatch 集成会根据大量不同指标提供经过集成的监控和提醒功能,从而帮助您改善最终用户体验。您可以收到 1 分钟 CloudWatch 指标、设置 CloudWatch 提醒和访问 CloudWatch 控制面板,从而查看 Amazon S3 存储的实时运行和性能。对依赖于云存储的 Web 和移动应用程序而言,这些功能使您可以快速识别运行问题并采取措施。这些 1 分钟指标在 S3 存储桶级别提供。此外,您还可以为使用共享前缀或对象标签收集的指标灵活地定义筛选条件,这样您便可使各项指标筛选条件满足特定业务应用程序、工作流程或内部组织的需求。
S3 CloudTrail 集成
您可以使用 AWS CloudTrail 捕捉 S3 对象上的存储桶级 API 活动(管理事件)和对象级 API 活动(数据事件)。数据事件包括 GET、HEAD 和 Get Object ACL 等读取操作,以及 PUT 和 POST 等写入操作。捕捉的详细信息可为多种类型的安全性、审计、监管与合规性使用案例提供支持。
数据生命周期管理
随着您的数据不断发展,Amazon S3 可以自动分配和更改成本和性能特性。它甚至还可以自动执行常见的数据生命周期管理任务,包括容量预置、自动迁移到成本较低的层级,以及监管合规性策略和最终的计划删除任务。
随着数据老化,或者在硬件故障或到达使用寿命时,Amazon S3 会自动并且透明地负责将您的数据迁移到新硬件上。这种机制让您不必执行昂贵、耗时且风险极大的硬件迁移。您可以设置生命周期策略,指示 Amazon S3 自动将老化数据迁移到成本较低的存储。您可以定义规则,根据数据的年限将 Amazon S3 对象自动迁移到标准 – 不频繁访问(标准 – IA)、Amazon S3 Glacier 或 Amazon S3 Glacier Deep Archive。您可以按存储桶、前缀或对象标签设置生命周期策略,以便指定最符合自身情况的精细度。
Amazon S3 还提供了编程选项,当数据达到其生命周期时,用于重复删除和大量删除。对于重复删除,您可以将规则定义为在预定义的时间段后删除对象集。这些规则可用于存储在标准或标准 – IA 中的对象,也适用于已存档至 Amazon S3 Glacier 或 Amazon S3 Glacier Deep Archive 的对象。
您还可以针对 Amazon S3 对象的版本定义生命周期规则以降低存储成本。例如,您可以创建规则,当您不再需要较旧版本的对象时自动将其彻底删除,从而节省资金并提高性能。除此之外,您还可以创建规则,将较旧的版本自动迁移到标准 – IA、Amazon S3 Glacier 或 Amazon S3 Glacier Deep Archive,从而进一步降低您的存储成本。
Amazon S3 智能分层
Amazon S3 智能分层(S3 智能分层)是唯一一个在访问模式变化时通过在四个访问分层之间移动对象来自动节省成本的云存储类。S3 智能分层存储类旨在通过自动将数据移动到最具成本效益的访问层来优化成本,而无操作开销。它通过将对象存储在四个访问层中来达到目的:两个低延迟访问层,针对频繁访问和不频繁访问进行了优化;以及两个可选存档访问层,专为异步访问而设计且针对罕见访问进行了优化。上传或转换至 S3 智能分层的对象自动存储在频繁访问分层中。为了实现每个对象每月只需少量的监视和自动化费用,Amazon S3 会在 S3 智能分层中监控对象的访问模式,然后将连续 30 天内未访问的对象移动到不频繁访问分层。您可以激活一个或两个存档访问层,可以将 90 天未访问的对象自动移动到存档访问层,然后在 180 天后将其移动到深度存档访问层。如果对象后来被访问,S3 智能分层会将对象移回到频繁访问分层。这意味着,存储在 S3 智能分层中的所有对象在需要时始终可用。当使用 S3 智能分层存储类时,没有检索费用,当在访问层之间移动对象时,也没有额外的分层费用。对于那些访问模式未知或不可预测的长期数据,它是理想的存储类。
成本监视和控制
Amazon S3 提供了多种用于管理和控制成本的功能。您可以使用 AWS 管理控制台和 Amazon S3 API 为 Amazon S3 存储桶添加标签,以便您将成本分配到多个业务维度,包括成本中心、应用程序名称或拥有者。然后,您可以使用 Amazon Web Services 的成本分摊报告(其中显示了按标签统计的使用情况和成本)来查看成本的分布。有关为 S3 存储段添加标签的详细信息,请参阅 Amazon S3 开发人员指南中的存储桶标记主题。
传输大量数据
您可以使用 AWS Direct Connect 将大量数据传输到 Amazon S3。借助 AWS Direct Connect,您可以轻松建立一个可连接本地设施和 AWS 的专用网络连接。使用 AWS Direct Connect,您可以在 AWS 和数据中心、办公室或主机托管环境之间建立私有连接。在很多情况下,这样做可以降低网络成本、提高带宽吞吐量,并提供比基于互联网的连接更为一致的网络体验。
事件通知
Amazon S3 事件通知可在响应对 Amazon S3 中上传或存储的对象采取措施时发送。通知消息可通过 Amazon SNS 或 Amazon SQS 发送,或直接传送到 AWS Lambda 中以调用 AWS Lambda 功能。
借助 Amazon S3 事件通知,您可以运行工作流程、发送提醒或执行其他用于响应 Amazon S3 中所存储对象更改的操作。您可以使用 Amazon S3 事件通知来设置触发器以执行各种操作,包括在上传媒体文件时转码,在数据文件可用时进行处理以及将 Amazon S3 对象与其他数据存储进行同步。您还可以根据对象名称前缀和后缀来设置事件通知。例如,您可以选择接收以 “images/” 开头的对象名称的通知。
您可以在存储桶级设置 Amazon S3 事件通知,然后通过 Amazon S3 控制台、REST API 或使用 AWS 软件开发工具包对其进行配置。
就地查询
S3 Select
Amazon S3 Select 旨在采用更快且更经济的方式,帮助分析和处理 Amazon S3 存储桶对象内的数据。它的工作原理是,通过使用简单的 SQL 表达式,提供从 Amazon S3 内对象中检索数据子集的功能。您的应用程序不必再使用计算资源即可扫描和筛选对象内的数据,这可能会使查询性能提升最高达 400%,使查询成本降低最高 80%。您只需将应用程序改为使用 SELECT(而不是 GET)即可使用 S3 Select。
性能
Amazon S3 提供行业领先的云对象存储性能。Amazon S3 支持并行请求,这意味着您可以根据计算集群的因素来扩展 S3 性能,而无需对应用程序进行任何自定义。性能按前缀扩展,因此您可以根据需要并行使用尽可能多的前缀,以达到所需的吞吐量。前缀数量没有限制。Amazon S3 性能支持每秒至少 3500 个添加数据的请求,以及每秒 5500 个检索数据的请求。每个 S3 前缀都可以支持这些请求率,从而可以轻松地显著提高性能。
要实现此 S3 请求率性能,您无需随机化对象前缀即可实现更快的性能。这意味着您可以在 S3 对象命名中使用逻辑或顺序命名模式,而不会对性能产生任何影响。有关 Amazon S3 性能优化的最新信息,请参阅 Amazon S3 性能指南和 Amazon S3 性能设计模式。
一致性
Amazon S3 针对任意存储请求为所有应用程序自动提供强大的写后读一致性,而无需更改性能或可用性,也不会影响应用程序的区域隔离,且无需支付额外费用。S3 具有强一致性,可加速和简化本地分析工作负载(如 Apache Spark 和 Apache Hadoop)的迁移,而无需对应用程序进行更改,并降低成本,而无需使用额外的基础设施来提供强一致性。
对 S3 存储的任何请求具有强一致性。成功写入新对象或覆盖现有对象后,任何顺序读取请求将立即收到对象的最新版本。S3 还为列表操作提供了强一致性,因此写入后,您可以立即列出存储桶中的对象,并反映所有更改。
Amazon S3 定价
中国(宁夏)区域
Amazon S3 存储定价
S3 标准存储(宁夏) | S3 智能分层存储,频繁访问层(宁夏) | S3 智能分层存储,不频繁访问层(宁夏) | S3 智能分层存储,存档访问层(宁夏) | S3 智能分层存储,深入存档访问层(宁夏) | S3 标准 – 不频繁访问存储(宁夏)* | S3 单区 – 不频繁访问存储(宁夏) | Amazon S3 Glacier 存储(宁夏) | Amazon S3 Glacier Deep Archive 存储(宁夏) | |
第一个 50TB/月 | 每 GB ¥ 0.1755 | 每 GB ¥ 0.1755 | 每 GB ¥ 0.1030029 | 每 GB ¥ 0.03006 | 每 GB ¥ 0.01082 | 每 GB ¥ 0.1030029 | 每 GB ¥ 0.08240232 | 每 GB ¥ 0.03006 | 每 GB ¥ 0.01082 |
下一个 450TB/月 | 每 GB ¥ 0.1719 | 每 GB ¥ 0.1719 | 每 GB ¥ 0.1030029 | 每 GB ¥ 0.03006 | 每 GB ¥ 0.01082 | 每 GB ¥ 0.1030029 | 每 GB ¥ 0.08240232 | 每 GB ¥ 0.03006 | 每 GB ¥ 0.01082 |
超过 500TB/月 | 每 GB ¥ 0.1629 | 每 GB ¥ 0.1629 | 每 GB ¥ 0.1030029 | 每 GB ¥ 0.03006 | 每 GB ¥ 0.01082 | 每 GB ¥ 0.1030029 | 每 GB ¥ 0.08240232 | 每 GB ¥ 0.03006 | 每 GB ¥ 0.01082 |
S3 智能分层存储 | |
监控和自动化,所有存储/月 | 每 1000 个对象 ¥ 0.016675 |
降低的冗余存储(宁夏) | |
第一个 1TB/月 | 每 GB ¥ 0.168 |
下一个 49TB/月 | 每 GB ¥ 0.163 |
下一个 450TB/月 | 每 GB ¥ 0.160 |
下一个 500 TB/月 | 每 GB ¥ 0.157 |
下一个 4000TB/月 | 每 GB ¥ 0.155 |
超过 5000TB/月 | 每 GB ¥ 0.152 |
* S3 标准 – 不频繁访问存储和 S3 单区 – 不频繁访问存储的最小对象大小为 128KB。小于此大小的对象将按 128KB 的存储量计费。
Amazon S3 请求定价
对于以下未指定的请求 | 定价(宁夏) |
PUT、COPY、POST 或 LIST 请求 | 每 1000 个请求 ¥ 0.00405 |
GET、SELECT 及所有其他请求 | 每 10000 个请求 ¥ 0.0135 |
删除请求 | 免费 * |
S3 Select 扫描的数据 | 每 GB ¥ 0.01433 |
S3 Select 返回的数据 | 每 GB ¥ 0.0051 |
对于 S3 智能分层请求 | 定价(宁夏) |
PUT、COPY、POST 或 LIST 请求 | 每 1000 个请求 ¥ 0.00405 |
GET、SELECT 及所有其他请求 | 每 1000 个请求 ¥ 0.00135 |
S3 Select 扫描的数据 | 每 GB ¥ 0.01433 |
S3 Select 返回的数据 | 每 GB ¥ 0.0051 |
数据检索和请求 | 定价(宁夏) |
频繁访问 | 每 GB ¥ 0.00 |
不频繁访问 | 每 GB ¥ 0.00 |
批量存档访问 | 每 GB ¥ 0.00 |
标准存档访问 | 每 GB ¥ 0.00 |
加速存档访问 | 每 GB ¥ 0.2001,按需:每个请求 ¥ 0.0667* |
批量深入存档访问 | 每 GB ¥ 0.00 |
标准深入存档访问 | 每 GB ¥ 0.00 |
对于标准低频率访问请求 | 定价(宁夏) |
PUT、COPY 或 POST 请求 | 每 1000 个请求 ¥ 0.04905 |
GET、SELECT 及所有其他请求 | 每 10000 个请求 ¥ 0.04905 |
转换至标准 – 不频繁访问的生命周期转换请求 | 每 1000 个请求 ¥ 0.05733 |
数据检索 | 每 GB ¥ 0.0637 |
S3 Select 扫描的数据 | 每 GB ¥ 0.01433 |
S3 Select 返回的数据 | 每 GB ¥ 0.0637 |
对于 S3 单区 – 不频繁访问请求 | 定价(宁夏) |
PUT、COPY 或 POST 请求 | 每 1000 个请求 ¥ 0.04905 |
GET、SELECT 及所有其他请求 | 每 10000 个请求 ¥ 0.04905 |
转换至单区 – 不频繁访问的生命周期转换请求 | 每 1000 个请求 ¥ 0.05733 |
数据检索 | 每 GB ¥ 0.0637 |
S3 Select 扫描的数据 | 每 GB ¥ 0.01433 |
S3 Select 返回的数据 | 每 GB ¥ 0.0637 |
对于 Amazon S3 Glacier 请求 | 定价(宁夏) |
对 S3 Glacier 的 PUT、COPY 或 POST 请求 | 每 1000 个请求 ¥ 0.22392 |
转换至 S3 Glacier 的生命周期转换请求 | 每 1000 个请求 ¥ 0.22392 |
S3 Glacier 检索费 | 请参考 S3 Glacier 检索定价 |
对于 Amazon S3 Glacier Deep Archive 请求 | 定价(宁夏) |
对 S3 Glacier Deep Archive 的 PUT、COPY 或 POST 请求 | 每 1000 个请求 ¥ 0.44784 |
数据检索请求 – 标准 | 每 1000 个请求 ¥ 0.7464 |
数据检索请求 – 批量 | 每 1000 个请求 ¥ 0.1668 |
转换至 S3 Glacier Deep Archive 的生命周期转换请求 | 每 1000 个请求 ¥ 0.44784 |
数据检索 – 标准(12 小时内) | 每 GB ¥ 0.1334 |
数据检索 – 批量(48 小时内) | 每 GB ¥ 0.0334 |
*删除标准或 RRS 对象的请求无需付费。S3 智能分层设计的最小对象大小为 128KB,用于自动分层。您可以存储更小的对象,但这些对象将按频繁访问分层的费率计费。S3 标准 – IA 和 S3 单区 – IA 存储的最小对象大小为 128KB。您可以存储更小的对象,但这些对象将按 128 KB 的存储量计费。S3 智能 – 分层、S3 标准 – IA 和 S3 单区 – IA 存储将按最低存储时间(30 天)付费。S3 Glacier 存储按最短存储期限(90 天)付费。S3 Glacier Deep Archive 存储按最短存储期限(180 天)付费。未满最短存储期限就被删除、覆盖或转移到其他存储类的对象将产生正常的使用费,以及针对最短期限的剩余天数按比例收取的存储费用。存储时间超过最短期限的对象不会产生按比例收取的费用。 |
Amazon S3 数据传输定价
以下定价基于“传入”和“传出” Amazon S3 的数据计算。
定价(宁夏) | |
数据传入至 Amazon S3 | |
所有传入数据 | 每 GB ¥0.000 |
数据自 Amazon S3 传出至 | |
同一区域的 Amazon EC2 | 每 GB ¥0.000 |
数据传出至互联网 | 每 GB ¥ 0.933(促销) |
存储和带宽大小包括所有文件开销。
S3 批量操作 | |
作业†† | 每个作业 ¥1.6675 |
对象†† | 执行的每一百万个对象操作 ¥6.67 |
††除了与 S3 批量操作代您执行的操作相关的任何费用外,您还需要为 S3 批量操作作业、对象和请求付费,包括数据传输、请求和其他费用。
中国(北京)区域
Amazon S3 存储定价
S3 标准存储(北京) | S3 智能分层存储,频繁访问层(北京) | S3 智能分层存储,不频繁访问层(北京) | S3 智能分层存储,存档访问层(北京) | S3 智能分层存储,深入存档访问层(北京) | S3 标准 – 不频繁访问存储(北京)* | S3 单区 – 不频繁访问存储(北京) | Amazon S3 Glacier 存储(北京) | Amazon S3 Glacier Deep Archive 存储(北京) | |
第一个 50TB/月 | 每 GB ¥ 0.195 | 每 GB ¥ 0.195 | 每 GB ¥ 0.13377 | 每 GB ¥ 0.0334 | 每 GB ¥ ¥ 0.01336 | 每 GB ¥ 0.13377 | 每 GB ¥ 0.107016 | 每 GB ¥ 0.0334 | 每 GB ¥ ¥ 0.01336 |
下一个 450TB/月 | 每 GB ¥ 0.191 | 每 GB ¥ 0.191 | 每 GB ¥ 0.13377 | 每 GB ¥ 0.0334 | 每 GB ¥ ¥ 0.01336 | 每 GB ¥ 0.13377 | 每 GB ¥ 0.107016 | 每 GB ¥ 0.0334 | 每 GB ¥ ¥ 0.01336 |
超过 500TB/月 | 每 GB ¥ 0.181 | 每 GB ¥ 0.181 | 每 GB ¥ 0.13377 | 每 GB ¥ 0.0334 | 每 GB ¥ ¥ 0.01336 | 每 GB ¥ 0.13377 | 每 GB ¥ 0.107016 | 每 GB ¥ 0.0334 | 每 GB ¥ ¥ 0.01336 |
S3 智能分层存储 | |
监控和自动化,所有存储/月 | 每 1000 个对象 ¥ 0.016675 |
降低的冗余存储(北京) | |
第一个 1TB/月 | 每 GB ¥ 0.168 |
下一个 49TB/月 | 每 GB ¥ 0.163 |
下一个 450TB/月 | 每 GB ¥ 0.160 |
下一个 500 TB/月 | 每 GB ¥ 0.157 |
下一个 4000TB/月 | 每 GB ¥ 0.155 |
超过 5000TB/月 | 每 GB ¥ 0.152 |
* S3 标准 – 不频繁访问存储和 S3 单区 – 不频繁访问存储的最小对象大小为 128KB。小于此大小的对象将按 128KB 的存储量计费。
Amazon S3 请求定价
对于以下未指定的请求 | 定价(北京) |
PUT、COPY、POST 或 LIST 请求 | 每 1000 个请求 ¥ 0.0045 |
GET、SELECT 及所有其他请求 | 每 10000 个请求 ¥ 0.015 |
删除请求 | 免费 * |
S3 Select 扫描的数据 | 每 GB ¥ 0.01593 |
S3 Select 返回的数据 | 每 GB ¥ 0.0057 |
对于 S3 智能分层请求 | 定价(北京) |
PUT、COPY、POST 或 LIST 请求 | 每 1000 个请求 ¥ 0.0045 |
GET、SELECT 及所有其他请求 | 每 10000 个请求 ¥ 0.0015 |
S3 Select 扫描的数据 | 每 GB ¥ 0.01593 |
S3 Select 返回的数据 | 每 GB ¥ 0.0057 |
数据检索 | 定价(北京) |
频繁访问 | 每 GB ¥ 0.00 |
不频繁访问 | 每 GB ¥ 0.00 |
批量存档访问 | 每 GB ¥ 0.00 |
标准存档访问 | 每 GB ¥ 0.00 |
加速存档访问 | 每 GB ¥ 0.2001,按需:每个请求 ¥ 0.0667* |
批量深入存档访问 | 每 GB ¥ 0.00 |
标准深入存档访问 | 每 GB ¥ 0.00 |
对于标准低频率访问请求 | 定价(北京) |
PUT、COPY 或 POST 请求 | 每 1000 个请求 ¥ 0.0637 |
GET、SELECT 及所有其他请求 | 每 10000 个请求 ¥ 0.0637 |
转换至标准 – 不频繁访问的生命周期转换请求 | 每 1000 个请求 ¥ 0.0637 |
数据检索 | 每 GB ¥ 0.0637 |
S3 Select 扫描的数据 | 每 GB ¥ 0.01593 |
S3 Select 返回的数据 | 每 GB ¥ 0.0637 |
对于 S3 单区 – 不频繁访问请求 | 定价(北京) |
PUT、COPY 或 POST 请求 | 每 1000 个请求 ¥ 0.0637 |
GET、SELECT 及所有其他请求 | 每 10000 个请求 ¥ 0.0637 |
转换至单区 – 不频繁访问的生命周期转换请求 | 每 1000 个请求 ¥ 0.0637 |
数据检索 | 每 GB ¥ 0.0637 |
S3 Select 扫描的数据 | 每 GB ¥ 0.01593 |
S3 Select 返回的数据 | 每 GB ¥ 0.0637 |
对于 Amazon S3 Glacier 请求 | 定价(北京) |
对 S3 Glacier 的 PUT、COPY 或 POST 请求 | 每 1000 个请求 ¥ 0.22392 |
转换至 S3 Glacier 的生命周期转换请求 | 每 1000 个请求 ¥ 0.22392 |
S3 Glacier 检索费 | 请参考 S3 Glacier 检索定价 |
对于 Amazon S3 Glacier Deep Archive 请求 | 定价(北京) |
对 S3 Glacier Deep Archive 的 PUT、COPY 或 POST 请求 | 每 1000 个请求 ¥ 0.44784 |
数据检索请求 – 标准 | 每 1000 个请求 ¥ 0.7464 |
数据检索请求 – 批量 | 每 1000 个请求 ¥ 0.1668 |
转换至 S3 Glacier Deep Archive 的生命周期转换请求 | 每 1000 个请求 ¥ 0.44784 |
数据检索 – 标准(12 小时内) | 每 GB ¥ 0.1334 |
数据检索 – 批量(48 小时内) | 每 GB ¥ 0.0334 |
*删除标准或 RRS 对象的请求无需付费。S3 智能分层设计的最小对象大小为 128KB,用于自动分层。您可以存储更小的对象,但这些对象将按频繁访问分层的费率计费。S3 标准 – IA 和 S3 单区 – IA 存储的最小对象大小为 128KB。您可以存储更小的对象,但这些对象将按 128 KB 的存储量计费。S3 智能 – 分层、S3 标准 – IA 和 S3 单区 – IA 存储将按最低存储时间(30 天)付费。S3 Glacier 存储按最短存储期限(90 天)付费。S3 Glacier Deep Archive 存储按最短存储期限(180 天)付费。未满最短存储期限就被删除、覆盖或转移到其他存储类的对象将产生正常的使用费,以及针对最短期限的剩余天数按比例收取的存储费用。存储时间超过最短期限的对象不会产生按比例收取的费用。 |
Amazon S3 数据传输定价
以下定价基于“传入”和“传出” Amazon S3 的数据计算。
定价(北京) | |
数据传入至 Amazon S3 | |
所有传入数据 | 每 GB ¥0.000 |
数据自 Amazon S3 传出至 | |
同一区域的 Amazon EC2 | 每 GB ¥0.000 |
数据传出至互联网 | 每 GB ¥ 0.933(促销) |
中国(北京)和中国(宁夏)这两个区域之间传输的数据 | 每 GB ¥ 0.6003 |
存储和带宽大小包括所有文件开销。
S3 批量操作 | |
作业†† | 每个作业 ¥1.6675 |
对象†† | 执行的每一百万个对象操作 ¥6.67 |
††除了与 S3 批量操作代您执行的操作相关的任何费用外,您还需要为 S3 批量操作作业、对象和请求付费,包括数据传输、请求和其他费用。
Amazon S3 常见问题
一般性问题
问:什么是 Amazon S3?
Amazon S3 是一种面向互联网的存储服务。它是一种简单的存储服务,以很低的成本为软件开发人员提供高度可扩展、可靠且延迟低的数据存储基础设施。
问:Amazon S3 有什么用途?
Amazon S3 提供一个简单的 Web 服务接口,可用于在 Web 上随时随地存储和检索任意数量的数据。使用此 Web 服务,开发人员可以轻松地构建利用互联网存储的应用程序。由于 Amazon S3 具有很高的可扩展性,而且您只需按实际用量付费,因此开发人员可以从较小用量起步,根据需要扩展应用程序,而不影响性能或可靠性。其设计具有很高的灵活性:存储您需要的任意类型和任意数量的数据;读取相同数据一百万次,或者仅在紧急灾难恢复时读取;构建简单的 FTP 应用程序或复杂的 Web 应用程序,例如 Amazon.com 零售网站。Amazon S3 可以将开发人员解放出来,让他们专注于创新,而不是考虑如何存储数据。
问:Amazon S3 有哪些技术优势?
Amazon S3 经过精心设计,可以满足 Amazon 内部开发人员必须达到的可扩展性、可靠性、速度、低成本和简易性要求。Amazon S3 可为任何外部开发人员提供这些相同优势。有关 Amazon S3 设计要求的更多信息,请参阅 Amazon S3 功能页面。
问:开发人员现在可以完成哪些以前无法做到的事情?
小规模的开发人员团队以前一直无法获得类似于 Amazon 的先进、可扩展的数据存储基础设施。Amazon S3 可以让任何开发人员利用 Amazon 自有的大规模优势,不需要预先投入资金,也不会影响性能。现在,开发人员可以尽情创新,因为他们知道无论其业务变得多么成功,他们都可以通过经济而简单的方式来确保其数据便于用户快速访问、始终可用且安全。
问:我可以存储多少数据?
您可以存储的数据总量和对象数量不受限制。各个 Amazon S3 对象的大小可能在 1 字节至 5TB 之间。可在单个 PUT 中上传的最大对象为 5GB。对于大于 100MB 的对象,客户应考虑使用分段上传功能。
问:如何删除大量对象?
您可以使用多对象删除,将大量对象从 Amazon S3 删除。借助此功能,您可以通过单个请求发送多个对象键,以加快删除速度。Amazon 不会向您收取使用多对象删除的费用。
**问:Amazon 是否将其数据存储在 Amazon S3 中?
**
是。Amazon 内的开发人员会在众多项目中使用 Amazon S3。其中很多项目均使用 Amazon S3 作为权威数据存储,并依赖它执行关键业务型操作。
问:Amazon S3 数据的组织方式是什么?
Amazon S3 是基于密钥的简单对象存储。存储数据时,您应分配唯一对象密钥,此后可使用该密钥来检索数据。密钥可以是任何字符串,并可以模仿分层结构属性。
问:我如何与 Amazon S3 连接?
Amazon S3 提供基于标准的简单 REST Web 服务接口,该接口可与任何互联网开发工具包结合使用。我们特意对这些操作进行了简化,以便轻松添加新的分发协议和功能层。
问:Amazon S3 的可靠性如何?
Amazon S3 让所有开发人员都能够访问同一个高度可扩展、快速可靠、低成本的数据存储基础设施,Amazon 使用该基础设施来运行自身的全球网站网络。S3 标准的设计可实现 99.99% 的可用性,标准 – IA 的设计可实现 99.9% 的可用性。两者都受到 Amazon S3 服务等级协议的支持。
问:如果来自我的应用程序的流量突然达到峰值,会出现什么情况?
Amazon S3 的设计初衷就是为了处理来自任何互联网应用程序的流量。按用量付费的定价以及无限制的容量,可以确保您的增量成本不会变化,而且您的服务也不会中断。Amazon S3 的庞大规模使得我们能够均衡地分布负载,因此,任何应用程序都不会受到流量峰值的影响。
**问:Amazon S3 的一致性模型是什么?
**
Amazon S3 针对任意存储请求自动提供强大的写后读一致性,而无需更改性能或可用性,也不会影响应用程序的区域隔离,且无需支付额外费用。
对 S3 存储的任何请求现在具有强一致性。成功写入新对象或覆盖现有对象后,任何顺序读取请求将立即收到对象的最新版本。S3 还为列表操作提供了强一致性,因此写入后,您可以立即列出存储桶中的对象,并反映所有更改。
问:强写后读一致性为何对我有所帮助?
当您需要在写入后立即读取对象时,强写后读一致性可为您提供帮助。例如,强写后读一致性可帮助处理 Apache Spark 和 Apache Hadoop 等工作负载,在这些工作负载中,您经常在写入对象后立即读取并列出。当对象被覆盖随后立即读取很多次时,强写后读一致性确保所有读取操作读取的都是最新写入,从而使高性能计算工作负载也受益。这些应用程序将自动立即受益于强写后读一致性。S3 强一致性还可降低成本,而无需使用额外的基础设施来提供强一致性。
服务等级协议 (SLA)
计费
[问:Amazon S3 的费用是多少?]
[问:使用 Amazon S3 如何收费和计费?]
[问:通过 AWS 管理控制台访问 Amazon S3 如何付费?]
[问:你们的价格是否包括税费?]
数据保护
问:Amazon S3 的持久性如何?
Amazon S3 可在指定年度内为对象提供 99.999999999% 的持久性。这种持久性水平对应的平均每年对象损失率预计为 0.000000001%。例如,如果您使用 Amazon S3 存储 10000 个对象,则平均每 10000000 年会发生一次单个对象丢失。
问:Amazon S3 的设计如何达到 99.999999999% 的持久性?
Amazon S3 将您的对象冗余存储在分布于您所指定的 Amazon S3 区域中多个设施的多台设备上。该服务可以快速检测和修复任何丢失冗余,从而抵御同时发生的设备故障。在处理对存储数据的请求时,该服务会在返回 SUCCESS 之前,将您的对象冗余存储于多个设施。Amazon S3 还定期使用校验和来验证您的数据完整性。
问:Amazon S3 使用哪些校验和来检测数据损坏?
Amazon S3 结合使用 Content-MD5 校验和及循环冗余检验 (CRC) 来检测数据损坏。Amazon S3 在空闲时对数据执行这些校验和检测,并使用冗余数据修复任何损坏。此外,在存储或检索数据时,该服务还对所有网络流量计算校验和,以检测数据包损坏。
问:什么是版本控制?
通过版本控制,您可以保留、提取和恢复存储在 Amazon S3 存储桶中的每个对象的每个版本。一旦您为存储桶启用版本控制,Amazon S3 将在您每次执行 PUT、POST、COPY 或 DELETE 操作时保留现有对象。默认情况下,GET 请求将提取最近写入的版本。可通过在请求中指定版本来检索已覆盖对象或已删除对象的旧版本。
问:为什么应该使用版本控制?
Amazon S3 为客户提供具有高持久性的存储基础设施。版本控制可在客户意外覆盖或删除对象的情况下提供一种恢复手段,从而提供另一层保护。这使您能够从无意用户操作或应用程序故障中轻松恢复。您还可将版本控制用于数据保留和存档。
问:如何开始使用版本控制?
您可以通过在 Amazon S3 存储桶上启用相应设置来开始使用版本控制。有关如何启用版本控制的更多信息,请参阅 Amazon S3 技术文档。
问:版本控制如何防止对象被意外删除?
当用户对某个对象执行 DELETE 操作时,后续默认请求将不再检索该对象。但是,该对象的所有版本将继续保留在您的 Amazon S3 存储桶中,您可以检索或恢复这些版本。只有 Amazon S3 存储桶的拥有者才能永久删除某个版本。
问:使用版本控制如何收费?
正常 Amazon S3 费率适用于存储或请求的对象的每个版本。
问:什么是 Amazon S3 Block Public Access?
Amazon S3 Block Public Access 是一组新的安全控制措施,让客户能够确保 S3 存储桶和对象不会受到公共访问。只需单击几下,管理员便可以将 Amazon S3 Block Public Access 设置应用于某个账户内的所有存储桶或特定存储桶。将这些设置应用到账户之后,与该账户关联的所有现有或新的存储桶和对象都会沿用阻止公共访问的设置。Amazon S3 Block Public Access 设置覆盖了允许公共访问的其他 S3 权限,这使得账户管理员能够轻松实施“无公共访问”策略,而不用考虑是否存在现有权限、存储桶的添加方式或创建方式。
问:为什么应该使用 Amazon S3 Block Public Access 设置?
通过 Amazon S3 Block Public Access 设置,您可以确保,无论是否在存储桶或对象上设置了现有策略,您都可以应用一项控制设置来指定 S3 资源现在或将来将不再具有公共访问权限。只需在 S3 控制台上单击几下,就可以防止在现在和将来在 S3 存储桶中设置公共策略和 ACL。要详细了解 Amazon S3 Block Public Access 设置,请访问“Amazon S3 开发人员指南”。
问:如何阻止对账户内所有存储桶的公共访问?
您可以通过 S3 控制台上的 Public access settings for this account(此账户的公共访问设置)侧导航栏或 API 来配置 Amazon S3 Block Public Access 设置。当您在账户级别配置这些设置后,整个账户中的所有存储桶和对象都会继承属性。如果要更改这些设置,则可以返回 S3 控制台并取消选中相应复选框,或通过 API 以编程方式对其进行管理。
问:如何阻止对特定存储桶的公共访问?
您可以通过 S3 控制台上的 permissions(权限)选项卡或通过 API 配置 Amazon S3 Block Public Access 设置。当您在存储桶级别配置这些设置后,系统将禁止对存储桶及其内部的对象进行公共访问。
问:什么是 Amazon S3 的 Amazon VPC 终端节点?
Amazon S3 的 Amazon VPC 终端节点是 VPC 内的逻辑实体,允许通过 AWS 中国网络连接到 S3。S3 有两种 VPC 终端节点:网关 VPC 终端节点和接口 VPC 终端节点。网关终端节点是您在路由表中指定的网关,用于通过 AWS 中国网络从 VPC 访问 S3。接口终端节点通过使用私有 IP 将请求从 VPC 内部、本地或来自其他 AWS 中国区域的请求路由到 S3,扩展了网关终端节点的功能。有关更多信息,请阅读 S3 文档。
问:能否允许从特定 Amazon VPC 终端节点访问 Amazon S3 存储桶?
您可以使用 Amazon S3 存储桶策略,限制从特定 Amazon VPC 终端节点或一系列终端节点访问存储桶。S3 存储桶策略现在支持条件 aws:sourceVpce,可使用该条件来限制访问。有关更多详细信息和示例策略,请阅读 S3 文档。
问:什么是适用于 Amazon S3 的 AWS PrivateLink?
适用于 S3 的 AWS PrivateLink 提供 Amazon S3 和本地之间的私有连接。您可以在 VPC 中为 S3 预置接口 VPC 终端节点,以便通过 AWS Direct Connect 将本地应用程序直接连接到 S3。无需再需要使用公有 IP、更改防火墙规则或配置互联网网关即可从本地访问 S3。
问:Amazon S3 的接口 VPC 终端节点如何工作?
接口 VPC 终端节点在 VPC 中预置弹性网络接口 (ENI)。ENI 是一个逻辑网络组件,您可以通过该组件将请求通过 AWS 中国网络路由到 S3。您可以在跨越一个或多个子网的一个或多个可用区中创建接口 VPC 终端节点。在您指定的每个子网中,将使用私有 IP 地址池中的 IP 地址来设置 ENI。对 S3 的请求将解析为分配给 ENIS 的私有 IP。以这种方式通过私有 IP 地址寻址 S3,可以从通过 AWS Direct Connect 连接到 AWS 的本地主机直接访问 S3。
问:如何开始使用 S3 的接口 VPC 终端节点?
您可以使用 AWS VPC 管理控制台、AWS CLI、AWS 开发工具包或 API 创建接口 VPC 终端节点。
问:何时应该选择网关 VPC 终端节点而不是基于 AWS PrivateLink 的接口 VPC 终端节点?
我们建议您使用接口 VPC 终端节点从本地或从其他 AWS 中国区域的 VPC 访问 S3。对于从与 S3 相同的 AWS 中国区域的 VPC 访问 S3 的资源,我们建议使用网关 VPC 终端节点,因为它们不计费。
S3 智能分层
问:什么是 S3 智能分层?
Amazon S3 智能分层(S3 智能分层)是一种 S3 存储类,适用于访问模式未知或不断变化且难以学习的数据。它是唯一一个在访问模式变化时通过在四个访问分层之间移动对象来自动节省成本的云存储。其中有两个针对频繁访问和不频繁访问进行了优化的低延迟访问层,以及两个专为异步访问而设计且针对罕见访问进行了优化的存档访问层。
上传或传输至 S3 智能分层的对象将自动存储在频繁访问分层。S3 智能分层会监控访问模式,然后将连续 30 天内未被访问的对象移动到不频繁访问分层。您可以激活一个或两个存档访问层,以自动将 90 天未访问的对象移动到存档访问层,然后在 180 天后将其移动到深度存档访问层。如果这些对象后来被访问,S3 智能分层会将其移动回频繁访问分层。这意味着,存储在 S3 智能分层中的所有对象在需要时始终可用。检索是免费的,因此当访问模式发生变化时,不会产生额外的存储费用。
问:为什么要选择使用 S3 智能分层?
S3 智能分层适用于访问模式未知或不断变化且难以学习的数据,也非常适合访问模式可能无法预测的数据集。对访问模式不断变化,且其中的对象子集长期很少访问的数据集,存档访问层可以进一步降低您的存储成本。S3 智能分层可用于存储新的数据集,在上传后不久,这些数据集的访问会变得频繁,但会随着数据集的老化而减少。
问:S3 智能分层可提供什么样的性能?
S3 智能分层频繁访问层和不频繁访问层可以提供与 S3 标准存储类相同的性能。存档访问层具有与 S3 Glacier 相同的性能,而深度存档访问层具有与 S3 Glacier Deep Archive 存储类相同的性能。
问:S3 智能分层的持久性和可用性如何?
S3 智能分层可提供 99.999999999% 的持久性,与 S3 标准存储类相同。S3 智能分层的设计可以提供 99.9% 的可用性,并附带服务等级协议,当在任意账单周期内的可用性低于我们的服务承诺时,还可提供服务抵扣金。
问:S3 智能分层如何收费?
SS3 智能分层会向您收取月度存储、请求和带宽费用,并对每个对象的监控和自动化收取少量月费。S3 智能分层存储类将对象存储在四个存储访问层中:频繁访问层,以 S3 标准存储费率定价;不频繁访问层,以 S3 标准 – 不频繁访问存储费率定价;存档访问层,以 S3 Glacier 存储的费率定价;以及深度存档访问层,以 S3 Glacier Deep Archive 的存储费率定价。
S3 智能分层不收取检索费。您只需支付少量监控和自动化费用,即可使用 S3 智能分层监控访问模式,并自动在四个访问层之间移动对象,以优化存储成本和性能。
S3 智能分层没有最小可计费对象大小,但小于 128K B的对象不符合自动分层的条件。未满 30 天就被删除、覆盖或转移到其他存储类的对象将产生正常的使用费,以及针对最短 30 天的剩余天数按比例收取的费用。对于在 S3 智能分层中存档到存档访问层或深度存档访问层的每个对象,Amazon S3 提供 8KB 的空间来存储对象名称和其他元数据(按 S3 标准存储费率计费),提供 32KB 的空间用来存储索引和相关元数据(按 S3 Glacier 和 S3 Glacier Deep Archive 的存储费率计费)。
问:如何激活 S3 智能分层存档访问层?
您可以使用 Amazon S3 API、CLI 或 S3 管理控制台创建存储桶,前缀或对象标签级别配置,以此来激活存档访问层和深度存档访问层。如果您的对象可以通过应用程序进行异步访问,您应该仅激活一个或两个存档访问层。
问:是否可以延长将对象存档至 S3 智能分层存储类的时间?
可以。在存储桶、前缀或对象标签级别的配置中,您可以将在 S3 智能分层中存档对象的最后访问时间延长至两年。将对象移至存档访问层的最短最后访问时间为 90 天,将对象移入深度存档访问层的最短最后访问时间为 180 天。
问:如何从 S3 INT 存储类的存档访问层或深度存档访问层中获取对象?
您可以发出“还原”请求,对象将自动开始移回至频繁访问层,所有这些操作均可在 S3 智能分层存储类中完成。存档访问层中的对象移至频繁访问层最多需要 3-5 小时,深度存档访问层中的对象移至频繁访问层最多需要 12 小时。对象移至频繁访问层之后,您可以发送 GET 请求检索该对象。
问:我的 S3 智能分层对象是否受到 Amazon S3 服务等级协议的支持?
是的,S3 智能分层由 Amazon S3 服务等级协议提供支持,当在任意账单周期内的可用性低于我们的服务承诺时,客户还可获得服务抵扣金。
问:使用 S3 智能分层会对我的延迟和吞吐量性能产生什么影响?
使用 S3 智能分层频繁访问层和不频繁访问层时,延迟和吞吐量性能将与 S3 标准相同。仅当对象可以通过应用程序异步访问时,才应激活存档访问层。存档访问层中的对象移至频繁访问层最多需要 3-5 小时,深度存档访问层中的对象移至频繁访问层最多需要 12 小时。如果需要更快访问存档访问层或深度存档访问层中的对象,您可以使用控制台选择加快检索速度,支付加快检索费用。
问:S3 智能分层是否有最短持续时间?
S3 智能分层的最短存储时间为 30 天,这意味着未满 30 天就被删除、覆盖或转移到其他 S3 存储类的数据将产生正常的使用费,以及针对最短 30 天的剩余天数按比例收取的费用。
问:S3 智能分层是否有最小对象大小?
S3 智能分层没有最小可计费对象大小,但小于 128KB 的对象不符合自动分层的条件,并且始终以频繁访问层费率存储。对于在 S3 智能分层中存档到存档访问层或深度存档访问层的每个对象,Amazon S3 提供 8KB 的空间来存储对象名称和其他元数据(按 S3 标准存储费率计费),提供 32KB 的空间用来存储索引和相关元数据(按 S3 Glacier 和 S3 Glacier Deep Archive 的存储费率计费)。这让您可以使用 S3 LIST API 或 S3 库存报告实时获取所有 S3 对象的列表。
S3 标准 – 不频繁访问
问:什么是 S3 标准 – 不频繁访问?
Amazon S3 S3 标准 – 不频繁访问(标准 – IA)是一种 Amazon S3 存储类,用于不常访问但在需要时要求快速访问的数据。Standard – IA 提供较高的持久性、吞吐量和较低的 Amazon S3 Standard 延迟,并且每 GB 的存储价格和检索费用都较低。成本较低且性能出色使得 Standard – IA 成为长期存储和备份的理想选择,也非常适用于灾难恢复的数据存储。Standard – IA 存储类别被设置在对象级别,并可在相同的存储桶中作为 Standard 数据存在,从而让您可以使用生命周期政策在存储类别间自动转移对象,无需更改任何应用程序。
问:为什么要选择使用 Standard – IA?
Standard – IA 非常适用于较不频繁访问,但在需要时也要求快速访问的数据。Standard – IA 非常适用于长期文件存储、来自同步和分享的较旧数据、备份数据以及灾难恢复文件。
问:S3 Standard – Infrequent Access 能提供什么样的性能?
S3 Standard – Infrequent Access 提供的性能与 S3 Standard 存储相同。
问:Standard – IA 的持久性和可用性如何?
S3 Standard – IA 的设计可提供 99.999999999% 的持久性,与 Standard 和 Amazon Glacier 相同。Standard – IA 的设计可提供 99.9% 的可用性,并附带服务等级协议,当在任意账单周期内可用性低于我们的服务承诺时,还可提供服务积分。
问:如何将我的数据导入 Standard – IA?
有两种方式可以将数据导入 Standard – IA。通过在 x-amz-storage-class 标头中指定 STANDARD_IA,您可以直接将数据放入 Standard – IA。您可以通过设置生命周期策略来将对象从 Standard 转移到 Standard – IA。
问:我的标准 – IA 对象是否受到 Amazon S3 服务等级协议的支持?
是。S3 标准 – IA 以 Amazon S3 服务等级协议作为后盾,当在任意账单周期内的可用性低于我们的服务承诺时,还可向客户提供服务积分。
问:使用标准 – IA 会对我的延迟和吞吐量性能产生什么影响?
当使用 Standard – IA 时,延迟和吞吐量性能将与 Amazon S3 Standard 相同。
问:Standard – IA 是否有最低持续时间?
Standard – IA 的设计适用于长期但非频繁访问的数据(已保留了数月或数年)。30 天内从 Standard – IA 删除的数据将按照完整的 30 天收费。
问:Standard – IA 是否有最小对象大小?
Standard – IA 的设计适用于较大对象,最小对象大小为 128KB。小于 128KB 的对象将产生存储费用,并按 128KB 计费。比如,S3 标准 – IA 中 6KB 的对象将产生 6KB 的 S3 标准 – IA 存储费用,而剩下的最小对象大小(等于 122KB)将按照 S3 标准 – IA 存储定价收取。
问:能否将标准 – IA 的对象捆绑到 Amazon S3 Glacier?
能。除了使用生命周期策略将对象从标准迁移到标准 – IA 之外,您还可以将生命周期策略设置为将 标准 – IA 的对象分层到 Amazon S3 Glacier。
S3 单区 – 不频繁访问
问:什么是 S3 One Zone-IA 存储类?
S3 单区 – IA 存储类是一个 Amazon S3 存储类,让客户可以选择将对象存储在单个可用区中。S3 单区 – IA 存储以冗余方式将数据存储在单个可用区内,这种存储的成本比地理上冗余的 S3 标准 – IA 存储的成本低 20%,而后者是以冗余方式将数据存储在多个地理上分离的可用区内。
S3 单区 – IA 提供 99% 的可用性 SLA,并且在可用区内的持久性还能够达到 99.999999999%。但是,与 S3 标准存储类不同的是,S3 单区 – IA 存储类不能灵活应对由地震或洪水等重大事件造成的可用区物理损失。
S3 One Zone-IA 存储提供与 S3 Standard 和 S3 Standard-IA 相同的 Amazon S3 功能,用户可以通过 Amazon S3 API、CLI 和控制台使用这种存储类。S3 单区 – IA 存储类是在对象级别进行设置的,并且可以和 S3 标准和 S3 标准 – IA 标准存储类存在于同一个存储桶中。您可以使用 S3 生命周期策略在存储类之间自动转移对象,而无需更改任何应用程序。
问:S3 单区 – IA 存储类最适合用于哪些使用案例?
客户将 S3 单区 – IA 存储类用于访问频率较低的存储,如备份副本、灾难恢复副本或其他易于重新创建的数据。
问:S3 单区 – IA 存储类可提供什么样的性能?
S3 单区 – IA 存储类可提供与 S3 标准和 S3 标准 – 不频繁访问存储类的性能相似的性能。
问:S3 单区 – IA 存储类的持久性如何?
S3 单区 – IA 存储类在一个可用区内的持久性可达到 99.999999999%。但是,S3 单区 – IA 存储不能承受住可用性下降或可用区完全毁坏的情况。相比之下,S3 Standard 和 S3 Standard-Infrequent Access 存储能够承受住可用性下降或可用区毁坏的情况。S3 单区 – IA 存储可以提供与大多数现代物理数据中心相当或更高的持久性和可用性,同时还提供存储弹性和 Amazon S3 功能集的额外优势。
问:S3 单区 – IA 存储类的可用性 SLA 如何?
S3 单区 – IA 可以提供 99% 的可用性 SLA。相比而言,S3 标准提供 99.9% 的可用性 SLA,而 S3 标准 – 不频繁访问提供 99% 的可用性 SLA。与所有 S3 存储类一样,S3 单区 – IA 存储类附带服务等级协议,当在任意账单周期内的可用性低于我们的服务承诺时,还可提供服务积分。
问:使用 S3 单区 – IA 存储会对我的延迟和吞吐量产生什么影响?
使用 S3 单区 – IA 存储类时,您应该会具有与使用 Amazon S3 标准和 S3 标准 – IA 存储类时近似的延迟和吞吐量。
**问:使用 S3 单区 – IA 存储类是如何收费的?
**
与 S3 标准 – IA 一样,S3 单区 – IA 会根据每月存储量、带宽、请求数量收费,同时还会收取提早删除费和较小对象存储费以及数据检索费。与 Amazon S3 标准 – IA 相比,Amazon S3 单区 – IA 存储的每月存储费用要低 20%,而带宽和请求的定价、提早删除费和较小对象存储费以及数据检索费与之相同。
与 S3 标准 – 不频繁访问一样,如果您在创建 S3 单区 – 不频繁访问对象之后的 30 天内将其删除,则需要支付提早删除费。例如,如果您对某个对象执行了 PUT 操作,然后在 10 天后将其删除,则仍需支付 30 天的存储费用。
与 S3 标准 – IA 一样,S3 单区 – IA 存储类的最小对象大小为 128KB。小于 128KB 的对象将产生存储费用,并按 128KB 计费。比如,S3 单区 – IA 存储类中 6KB 的对象将产生 6KB 的存储费用,而剩下的最小对象大小(等于 122KB)将按照 S3 单区 – IA 存储定价收取。请参阅定价页面,了解有关 S3 单区 – IA 定价的信息。
问:S3 单区 – IA 中的“区域”与 AWS 可用区是否一样?
是。每个 AWS 区域都是一个独立的地理区域。每个区域都有多个相互隔离的位置,称为可用区。Amazon S3 单区 – IA 存储类使用区域内的单个 AWS 可用区。
问:Amazon EC2 和 Amazon S3 使用特定于可用区的资源的方式有差异吗?
有。Amazon EC2 让您能够在区域内选择可用区来放置资源,例如计算实例。当您使用 S3 单区 – IA 时,它会根据可用容量分配区域内的一个 AWS 可用区。
问:是否可以拥有在不同存储类和可用区具有不同对象的存储桶?
可以。您可以拥有包含存储在 S3 标准、S3 标准 – IA 和 S3 单区 – IA 中的不同对象的存储桶。
**问:S3 单区 – IA 是否在 S3 运行的所有 AWS 区域都可用?
**
是
**问:通过使用 S3 单区 – IA,我将放弃多少灾难恢复保护能力?
**
每个可用区均使用冗余电源和联网。在 AWS 区域内,可用区位于不同的冲积平原和地震断裂带,并且在地理位置上是分离的,以避免受到火灾的影响。S3 Standard 和 S3 Standard-IA 存储类通过以冗余方式将数据存储在多个可用区来避免受到这类灾难的影响。S3 One Zone-IA 可以保护用户免受可用区内设备故障的影响,但无法抵御可用区丢失的影响。使用 S3 单区 – IA、S3 标准和 S3 标准 – IA 选项,您可以选择最符合您的存储持久性和可用性要求的存储类。
Amazon S3 和 IPv6
问:在使用 IPv6 时,Amazon S3 的性能是否会发生变化?
问:如果客户端在 Amazon S3 中使用 IPv6 时受到策略、网络或其他限制的影响,该怎么办?
问:能否在 Amazon S3 的所有功能中使用 IPv6?
Amazon S3 Glacier
问:Amazon S3 是否能将对象存档到费用更低的存储选项?
可以,Amazon S3 让您能够将 Amazon S3 Glacier 的费用极低的存储类用于数据存档。Amazon S3 Glacier 针对不常访问的数据进行了优化,检索时间为分钟。此类应用示例包括了数字媒体归档、财务和健康记录、原始基因组序列数据、长期数据库备份,以及法律规定必须保留的数据。
问:如何将数据存储在 Amazon S3 Glacier?
您可以根据生命周期,利用生命周期策略自动将 Amazon S3 数据元集存档到 Amazon Glacier。使用 Amazon S3 管理控制台、AWS 开发工具包或 Amazon S3 API 来定义存档规则。规则将指定前缀和时间期限。前缀(如:“logs/”)识别服从此规格的数据对象。时间期限可指定在该数据对象创建多少天(如 180 天)或在某个日期后应将该数据对象存档。若名称以指定前缀开头,并且超过指定时间期限的 Amazon S3 Standard 或 Amazon S3 Standard – IA 对象都将归档到 Amazon S3 Glacier。要检索存储在 Amazon S3 Glacier 中的 Amazon S3 数据,您需要通过 Amazon S3 API 或管理控制台启动恢复任务。恢复任务通常会在 3 到 5 小时内完成。任务完成后,您可以通过 Amazon S3 GET 对象查询来访问这些数据。
问:是否可以使用 Amazon S3 API 或管理控制台来列出已存档到 Amazon S3 Glacier 的对象?
可以,与其他 Amazon S3 存储类(S3 标准或 S3 标准 – IA)类似,使用 Amazon S3 API 或管理控制台存储在 Amazon Glacier 中的对象也有相关联的用户定义名称。您可以使用 Amazon S3 LIST API 实时获得所有 Amazon S3 对象名称的列表,包括那些使用 Amazon S3 Glacier 选项进行存储的对象。
问:是否可以使用 Amazon S3 Glacier 直接 API 来访问已存档到 Amazon S3 Glacier 的对象?
由于 Amazon S3 维护着用户定义对象名称和 Amazon S3 Glacier 系统定义标识符之间的映射,所以使用 Amazon S3 Glacier 存储类存储的 Amazon S3 对象只能通过 Amazon S3 API 或 Amazon S3 管理控制台来访问。
问:如何恢复存档在 Amazon S3 Glacier 中的数据元?
要恢复存储在 Amazon S3 Glacier 中的 Amazon S3 数据,您需要使用 Amazon S3 API 或 Amazon S3 管理控制台提出恢复请求。恢复请求常会在 3 到 5 小时内完成。恢复请求会在 RRS 中创建临时数据副本,同时在 Amazon S3 Glacier 中完整保留已存档数据。您可以以天为单位指定将临时副本存储在 RRS 上的时间。然后,可以通过 Amazon S3 GET 从 RRS 请求访问已存档对象的临时副本。
**问:恢复存档在 Amazon S3 Glacier 中的对象需要多长时间?
**
处理恢复任务时,Amazon S3 首先从 Amazon S3 Glacier 检索请求的数据(通常需要 3-5 小时),然后在 RRS 中创建请求数据的临时副本(通常需要数分钟)。您可以认为大部分通过 Amazon S3 API 或管理控制台启动的恢复任务可在 3-5 小时内完成。
**问:可以免费恢复多少数据?
**
您每月最多可以免费恢复存储在 Amazon S3 Glacier 中的 Amazon S3 数据的 5%。一般而言,这足以满足您备份和归档需要。每月 5% 的最高免费恢复限额是按日比例计量的。例如,您在某一天,将 12 TB 的 Amazon S3 数据归档到 Amazon S3 Glacier,那么这一天您可以免费恢复 20.5 GB 数据(假定该月为 30 天,则为:12 TB x 5% / 30 天 = 20.5 GB)。
问:删除存储在 Amazon S3 Glacier 中不到 3 个月的数据元时,如何收费?
Amazon S3 Glacier 旨在用于数月、数年甚至数十年保留数据。如果要删除的数据元已存档在 Amazon S3 Glacier 中不少于 3 个月,则可以免费删除。如果要在存档后三个月内删除或覆盖存档在 Amazon S3 Glacier 中的数据元,则需要交纳提早删除费。该项费用是按比例收取的。如果您在上传 1 个月后删除 1GB 数据,则需要支付提早删除费,用于支付后面 2 个月的 Amazon S3 Glacier 存储费。如果您 2 个月后删除 1GB,则需要支付 1 个月的 Amazon S3 Glacier 存储费。
Amazon S3 Glacier Deep Archive
问:什么是 Amazon S3 Glacier Deep Archive?
Amazon S3 Glacier Deep Archive 是一种新的 Amazon S3 存储类,可为长期保存每年访问一两次的数据提供安全和持久的对象存储。Amazon S3 Glacier Deep Archive 的云存储成本最低,每月每 GB 仅 ¥ 0.012 起,远低于存储和维护本地磁带库或异地存档数据的价格。
问:Amazon S3 Glacier Deep Archive 最适用于哪些使用案例?
Amazon S3 Glacier Deep Archive 是一种理想的存储类,可以为公司最重要的数据资产提供离线保护,或者在根据公司政策、合同或监管合规性要求需要长期保留数据时提供离线保护。客户发现,Amazon S3 Glacier Deep Archive 是一个非常有吸引力的选择,它可以用来保护核心知识产权、金融和医疗记录、研究结果、法律文件、地震勘探研究和长期备份的,特别是在金融服务、医疗、石油和天然气以及公共部门等监管严格的行业。此外,还有一些组织希望保留核心知识产权的备份副本,比如媒体和娱乐公司。通常,使用 Amazon S3 Glacier Deep Archive 的客户可以减少或停止使用本地磁带库和本地之外的磁带存档服务。
问:Amazon S3 Glacier Deep Archive 和 Amazon S3 Glacier 有何不同?
Amazon S3 Glacier Deep Archive 拓宽了我们的数据存档产品范围,使您能够根据存储和检索成本以及检索时间选择最佳存储类。如果您需要使用加速检索在短短 1-5 分钟内检索存档数据,请选择 Amazon S3 Glacier。相比之下,Amazon S3 Glacier Deep Archive 专用于不太可能访问但仍然需要长期持久存储的冷数据。Amazon S3 Glacier Deep Archive 的费用比 Amazon S3 Glacier 低 75%,可在 12 小时内使用标准检索速度提供检索。您还可以通过选择批量检索来降低检索成本,批量检索将在 48 小时内返回数据。
问:Amazon S3 Glacier Deep Archive 的持久性和可用性如何?
与 Amazon S3 标准和 Amazon S3 Glacier 存储类一样,Amazon S3 Glacier Deep Archive 的设计也可实现 99.999999999% 的持久性。Amazon S3 Glacier Deep Archive 设计用于提供 99.9% 的可用性,并附带服务等级协议,当在任意计费周期内的可用性低于我们的服务承诺时,还可提供服务积分。
问:我的 Amazon S3 Glacier Deep Archive 对象是否受到 Amazon S3 服务等级协议的支持?
是,Amazon S3 Glacier Deep Archive 以 Amazon S3 服务等级协议作为后盾,当在任意账单周期内的可用性低于我们的服务承诺时,还可向客户提供服务积分。
**问:如何开始使用 Amazon S3 Glacier Deep Archive?
**
在 Amazon S3 Glacier Deep Archive 中存储数据的最简单方法是使用 S3 API 直接上传数据。只需指定“Glacier Deep Archive”作为存储类即可。您可以利用 AWS 管理控制台、S3 REST API、AWS 开发工具包或 AWS 命令行界面来完成该指定操作。
您还可以通过使用 S3 生命周期来创建迁移数据的策略,以此开始使用 Amazon S3 Glacier Deep Archive,S3 生命周期提供了定义对象生命周期和降低存储成本的能力。您可以将这些策略设置为根据对象的年限将其迁移到 Amazon S3 Glacier Deep Archive。您可以为 S3 存储桶或特定前缀指定策略。生命周期转换按 Amazon S3 Glacier Deep Archive 上传价格计费。
AWS Tape Gateway 是 AWS Storage Gateway 的一项基于云的虚拟磁带库功能,现与 Amazon S3 Glacier Deep Archive 集成,使您能够在 Amazon S3 Glacier Deep Archive 中存储基于磁带的虚拟长期备份和存档,从而为云中的这些数据提供最低成本的存储。首先,使用 AWS Storage Gateway Console 或 API 创建一个新的虚拟磁带,并将存档存储目标设置为 Amazon S3 Glacier 或 Amazon S3 Glacier Deep Archive。当备份应用程序弹出磁带时,磁带将存档到选定的存储目标中。
**问:对于将数据从现有的磁带存档迁移到 Amazon S3 Glacier Deep Archive,您有何建议?
**
有多种方法可以将数据从现有磁带存档迁移到 Amazon S3 Glacier Deep Archive。您可以使用 AWS Tape Gateway,通过虚拟磁带库 (VTL) 接口与现有备份应用程序集成。此接口可以将虚拟磁带提供给备份应用程序。以上操作可以立即将数据存储在 Amazon S3、Amazon S3 Glacier 和 Amazon S3 Glacier Deep Archive。
您还可以使用 AWS Snowball 来迁移数据。Snowball 可使用能确保传输安全的物理存储设备,加快 TB 到 PB 级数据迁入和迁出 AWS 的速度。使用 Snowball 有助于解决进行大规模数据传输时会遇到的难题,包括网络费用高、传输时间长和安全问题。
最后,您可以使用 AWS Direct Connect 来建立从本地到 AWS Direct Connect 位置的专用网络连接。在许多情况下,Direct Connect 可以降低网络成本,增加带宽吞吐量,并提供比基于互联网的连接更一致的网络体验。
问:如何检索存储在 Amazon S3 Glacier Deep Archive 中的对象?
要检索存储在 Amazon S3 Glacier Deep Archive 中的数据,请使用 Amazon S3 API 或 Amazon S3 管理控制台发起“还原”请求。“还原”会在 S3 RRS 存储类中创建数据的临时副本,同时使 Amazon S3 Glacier Deep Archive 中的已存档数据保持完整。您可以使用天为单位指定将临时副本存储在 S3 上的时间。然后,可以通过 Amazon S3 GET 从 S3 中请求访问已存档对象的临时副本。
还原一个存档对象时,您可以在请求正文的 Tier 元素中指定以下一个选项:标准为默认层并允许您在 12 小时内访问您存档的任何对象,Bulk 允许您检索大量数据,甚至是 PB 级的数据,而且成本低廉,通常在 48 小时内就可以完成。
问:使用 Amazon S3 Glacier Deep Archive 时如何收费?
Amazon S3 Glacier Deep Archive 存储的定价基于您所存储数据的 GB 量、PUT/生命周期转换请求数、检索的 GB 数以及恢复请求数。该定价模型类似于 Amazon S3 Glacier。请参阅 Amazon S3 定价页,获取有关 Amazon S3 Glacier Deep Archive pricing 定价的信息。
问:Amazon S3 Glacier Deep Archive 是否存在最低的存储持续时间和最低的对象存储费用?
Amazon S3 Glacier Deep Archive 专为长期保存但很少访问的数据而设计,这些数据可以保存 7-10 年或更长时间。存档到 Amazon S3 Glacier Deep Archive 中的对象最短可存储 180 天,同时未满 180 天就被删除的对象所产生的按比例支付的费用等于按剩余天数支付的存储费用。请参阅 Amazon S3 定价页,获取有关 Amazon S3 Glacier Deep Archive pricing 定价的信息。
Amazon S3 Glacier Deep Archive 的最小计费对象存储大小为 40KB。您可以存储小于 40KB 的对象,但将按 40KB 存储空间计费。请参阅 Amazon S3 定价页,获取有关 Amazon S3 Glacier Deep Archive pricing 定价的信息。
问:Amazon S3 Glacier Deep Archive 如何与其他 AWS 服务相集成?
Amazon S3 Glacier Deep Archive 集成了 Amazon S3 功能,包括 S3 存储类分析、S3 对象标记、S3 生命周期策略和 S3 对象锁定。通过 S3 存储管理功能,您可以使用单个 Amazon S3 存储桶存储 Amazon S3 Glacier Deep Archive、S3 标准、S3 标准 – IA、S3 单区 – IA 和 Amazon S3 Glacier 数据的混合体。这让存储管理员可以基于数据和数据访问模式的性质做出决策。客户可以使用 Amazon S3 生命周期策略将老化的数据自动迁移到成本较低的存储类。
AWS Storage Gateway 服务可将 Tape Gateway 与 Amazon S3 Glacier Deep Archive 存储类集成,这样您就可以将虚拟磁带存储在成本最低的 Amazon S3 存储类中,从而将云中存储长期数据的每月成本降低最多 75%。使用此功能,磁带网关支持将您的新虚拟磁带直接存档到 Amazon S3 Glacier 和 Amazon S3 Glacier Deep Archive,从而帮助您满足备份、存档和恢复要求。磁带网关可帮助您将基于磁带的备份移动到 AWS,而无需对现有备份工作流程进行任何更改。磁带网关支持大多数领先的备份应用程序,例如 Veritas、Veeam、Commvault、Dell EMC NetWorker、IBM Spectrum Protect(在 Windows OS 上)和 Microsoft Data Protection Manager。
事件通知
问:什么是 Amazon S3 事件通知?
Amazon S3 事件通知可在响应 Amazon S3 中的操作(如 PUT、POST、COPY 或 DELETE)时发送。通知消息可以通过 Amazon SNS 或 Amazon SQS 发送。
问:我可以用 Amazon S3 事件通知做什么?
Amazon S3 事件通知让您可以运行工作流、发送警报或执行其他操作,作为 Amazon S3 中存储对象更改的响应。使用 Amazon S3 事件通知,您可以设置触发器来执行各种操作,包括在上传媒体文件时转码,在数据文件可用时进行处理,以及将 Amazon S3 对象与其他数据存储进行同步。您还可以根据对象名前缀和后缀来设置事件通知。例如,您可以选择接收以“images/”开头的对象名称的通知。
问:Amazon S3 事件通知中包含什么?
有关 Amazon S3 事件通知消息中所含信息的详细描述,请参考“Amazon S3 开发人员指南”中的“配置 Amazon S3 事件通知”主题。
问:如何设置 Amazon S3 事件通知?
关于如何配置事件通知的详细描述,请参考 Amazon S3 开发人员指南中的“配置 Amazon S3 事件通知”主题。
问:使用 Amazon S3 事件通知的费用是多少?
使用 Amazon S3 事件通知无需支付额外费用。发送事件通知时,您只需为 Amazon SNS 或 Amazon SQS 的使用付费。要查看这些服务的定价详细信息,请访问 Amazon SNS 或 Amazon SQS 定价页面。
存储管理
存储类分析 | S3 清单 | S3 CloudWatch 指标 | S3 对象标签 | 生命周期管理策略 | 复制
存储类分析
问:什么是 S3 分析 – 存储类分析?
借助存储类分析,您可以分析存储访问模式并将相应数据转移到合适的存储类。这一新的 S3 分析功能可自动识别何时为不频繁使用模式,以帮助您将存储转换为 S3 标准 – IA、S3 单区 – IA、Amazon S3 Glacier 或 Amazon S3 Glacier Deep Archive。您可以配置存储类分析策略来监控整个存储桶、前缀或对象标签。对不频繁访问模式进行观察后,您可以基于结果轻松创建新的生命周期寿命策略。存储类分析还以可视化方式在 AWS 管理控制台上提供您每天的存储使用情况,您可将这些分析结果导出至 S3 存储桶,使用您所选的商业智能工具进行分析。
问:如何开始使用 S3 分析 – 存储类分析?
您可以使用 AWS 管理控制台或 S3 PUT Bucket Analytics API 配置存储类分析策略,使之标识可转换为标准 – IA 或存档到 Glacier 的低频率访问存储。您可以导航至 S3 控制台中的 Management(管理)选项卡来管理 S3 分析、S3 清单和 S3 CloudWatch 指标。
问:使用 S3 分析 – 存储类分析时,如何收费?
有关 S3 分析 – 存储类分析定价的更多信息,欢迎致电咨询。
问:存储类分析多久更新一次?
存储类分析每日将在 S3 管理控制台上进行更新。此外,您可以将 S3 分析配置为将您的每日存储类分析导出到您选择的 S3 存储桶。
S3 清单
问:什么是 S3 清单?
针对 S3 存储桶或前缀每日或每周提供一次对象及其对应元数据的 ORC 文件输出。您可以使用 S3 清单简化并加快业务工作流和大数据作业。您可以使用 S3 清单验证对象的加密和复制状态是否符合业务、合规性和法规要求。
问:如何开始使用 S3 清单?
您可以使用 AWS 管理控制台或 PUT Bucket Inventory API,为您 S3 存储桶中的所有对象或某个共享前缀下的对象子集配置每日或每周清单。在配置过程中,您可以指定清单的目标 S3 存储桶、输出文件的输出格式(CSV 或 ORC)以及您的业务应用程序所需的具体对象元数据,例如:对象名称、大小、上次修改日期、存储类型、版本 ID、删除标记、非当前版本标记、分段上传标记、复制状态或加密状态。
问:S3 清单是否可以改善大数据作业和业务流程应用程序的性能?
可以,S3 清单可用作大数据作业或工作流程应用程序的现成输入,而不是同步的 S3 LIST API,从而节约了它在调用和处理 LIST API 响应方面所用的时间和计算资源。
问:可以对使用 S3 清单编写的文件进行加密吗?
可以,您可以通过配置,对使用 S3 清单编写的所有文件进行 SSE-S3 加密。有关更多信息,请参阅用户指南。
问:如何使用 S3 清单?
您可以将 S3 清单用作应用程序工作流程或大数据作业的直接输入。您也可以借助 Presto、Hive 和 Spark 等工具使用标准 SQL 语言查询 S3 清单。
问:使用 S3 清单时,如何收费?
请查看 Amazon S3 定价页面,获取有关 S3 清单定价的一般信息。
S3 CloudWatch 指标
问:如何开始使用 S3 CloudWatch 指标?
使用 AWS 管理控制台,您可在 1 分钟内为您的 S3 存储桶生成 CloudWatch 指标,或使用前缀或对象标签配置指标的筛选条件。此外,您还可以通过调用 S3 PUT Bucket Metrics API 来启用 S3 存储指标的发布并对其进行配置。存储指标在启用后的 15 分钟内即可在 CloudWatch 中使用。
问:我能否使存储指标符合我的应用程序或企业组织的需求?
能,您可以配置 S3 CloudWatch 指标,使之生成有关您 S3 存储桶的指标,或使用前缀或对象标签配置指标的筛选条件。例如,您可以将前缀“/Bucket01/BigData/SparkCluster”用作指标筛选条件 1,对访问数据的 spark 应用程序进行监控,并将标签“Dept, 1234”定义为指标筛选条件 2 (第二个指标筛选条件)。一个对象可以是多个筛选条件中的成员,例如,前缀“/Bucket01/BigData/SparkCluster”中的一个对象和带标签“Dept,1234”的对象都可以同时出现在指标筛选条件 1 和 2 中。这样,指标筛选条件便可符合业务应用程序、团队结构或组织预算需求,从而可在同一个 S3 存储桶中对多个工作负载分别进行监控和提醒。
问:可对存储指标设置哪些警报?
您可以使用 CloudWatch 对任何存储指标数量、计数器或等级设置阈值,当值达到此阈值时,就触发相应操作。例如,您对 4xx 错误响应的百分比设置一个阈值,当值超出此阈值至少 3 个数据点时,就触发 CloudWatch 警报以提醒开发运维工程师。
问:使用 S3 CloudWatch 指标时,如何收费?
S3 CloudWatch 指标是依据 Amazon CloudWatch 的自定义指标定价的。请查看 Amazon CloudWatch 定价页面,获取有关 S3 CloudWatch 指标定价的一般信息。
S3 对象标签
问:什么是对象标签?
S3 对象标签是适用于 S3 对象的键值对,在对象的生命周期内,可随时创建、更新或删除这些标签。借助这些标签,您将能够创建 Identity and Access Management (IAM) 策略,设置 S3 生命周期策略以及自定义存储指标。然后,这些对象级标签可以管理在存储类之间的转换并在后台让对象过期。
问:如何向对象应用对象标签?
您可以在上传新对象时向其添加标签,也可以向现有对象添加标签。每个 S3 对象最多可添加 10 个标签,您可以使用 AWS 管理控制台、REST API、AWS CLI 或 AWS 开发工具包添加对象标签。
问:为什么要使用对象标签?
借助对象标签这一新工具,您可以简化 S3 存储的管理。使用此工具,您能够在对象的生命周期内随时创建、更新和删除标签,从而使存储满足业务的需求。借助这些标签,您可以控制对标记有特殊键值对的对象的访问,从而进一步保护机密数据,使之仅供部分组或用户访问。对象标签还可用于为属于特定项目或业务单位的对象添加标签,将对象标签与生命周期策略结合使用可以管理向 S3 标准 – 不频繁访问和 Amazon S3 Glacier 存储类的转换。
问:为什么要使用对象标签?
借助对象标签这一新工具,您可以简化 S3 存储的管理。使用此工具,您能够在对象的生命周期内随时创建、更新和删除标签,从而使存储满足业务的需求。借助这些标签,您可以控制对标记有特殊键值对的对象的访问,从而进一步保护机密数据,使之仅供部分组或用户访问。对象标签还可用于为属于特定项目或业务单位的对象添加标签,将对象标签与生命周期策略结合使用可以管理向 S3 标准 – 不频繁访问和 Amazon S3 Glacier 存储类的转换。
问:如何更新对象上的对象标签?
在 S3 对象的生命周期内,您可以随时更改对象标签,您可以使用 AWS 管理控制台、REST API、AWS CLI 或 AWS 开发工具包更改对象标签。请注意,在 AWS 管理控制台之外进行的所有更改均是对整个标签集合进行的更改。如果某个特定对象关联了 5 个标签,您要为其添加第 6 个标签,那么您需要在该请求中包括最初的 5 个标签。
问:如果我使用跨区域复制,对象标签是否也会复制?
使用跨区域复制可以跨区域复制对象标签。有关设置跨区域复制的更多信息,请访问《Amazon S3 开发人员指南》中的“如何设置跨区域复制”。
对于已启用跨区域复制的客户,需要具有新的权限才能复制标签。有关所需策略的更多信息,请访问《Amazon S3 开发人员指南》中的“如何设置跨区域复制”。
问:对象标签的费用是多少?
有关更多信息,请访问 Amazon S3 定价页面。
生命周期管理策略
问:什么是生命周期管理?
借助 S3 生命周期管理,您可以通过预定义的策略定义对象的生命周期并降低存储成本。您可以设置生命周期转移策略,根据数据的寿命将 Amazon S3 对象自动迁移到标准 – 不频繁访问(标准 – IA)、Amazon S3 Glacier 和/或 Amazon S3 Glacier Deep Archive。您还可以设置生命周期过期策略,以便根据对象的寿命自动删除对象。您可以设置分段上传过期策略,以便基于上传时间终止尚未完成的分段上传。
问:如何设置生命周期管理策略?
您可以在 S3 控制台、S3 REST API、AWS 开发工具包或 AWS 命令行界面 (CLI) 中设置和管理生命周期策略。您可以在前缀或存储桶级别指定策略。
问:使用生命周期管理时,如何收费?
设置和应用生命周期策略无需额外付费。根据生命周期规则,当对象符合转移条件时,每个对象的转移请求都需付费。
问:生命周期管理策略有哪些用途?
随着时间推移,数据可能会不再那么重要且有价值,或不再符合合规性要求。Amazon S3 中包含各种各样的策略库,可帮助您自动执行数据迁移流程。例如,您可以将访问频率较低的对象设置为在一段时间后移动到成本较低的存储层级(例如标准 – 不频繁访问)。再过一段时间,它可能会移动到 Amazon S3 Glacier 中进行存档和实现合规性,并且最终会被删除。这些规则会在您不知觉的情况下降低存储成本并简化管理工作,还可用于 Amazon 系列存储服务。此外,这些策略还包含效果出色的管理实践,指导如何删除不再需要的对象和属性,从而管理成本并优化性能。
问:如何利用 Amazon S3 的生命周期策略来降低 Amazon S3 存储成本?
借助 Amazon S3 生命周期策略,您可以配置在特定时间期限后是将对象迁移到标准 – 不频繁访问(标准 – IA)、存档到 Amazon S3 Glacier 或 Amazon S3 Glacier Deep Archive,还是将其删除。您可以利用此策略驱动的自动化操作来轻松快速地降低存储成本和节省时间。在每个规则中,您都可以指定前缀、时间期限、转移到标准 – IA 或 Amazon S3 Glacier 和/或过期。例如,您可以创建一个规则,以便将带有常见前缀“logs/”且已创建了 30 天的所有对象都存档到 Amazon S3 Glacier,并使其在自创建之日起的 365 天后过期。您还可以另外创建一个规则,以便仅让带有前缀“backups/”且已创建了 90 天的所有对象过期。生命周期策略适用于现有和新的 S3 对象,可确保您能够针对所有当前数据和 S3 中存储的任何新数据优化存储并最大限度地节省成本,而无需进行耗时的手动数据检查和迁移。在生命周期规则内,前缀字段用于识别受该规则约束的对象。要将规则应用于单个对象,请指定键名称。要将规则应用于一组对象,请指定它们的共同前缀(如“logs/”)。您可以指定转移操作和过期操作以存档或删除对象。对于时间期限,请提供创建日期(如 2015 年 1 月 31 日)或自创建之日算起的天数(如 30 天),以便在此日期或超过此天数后将对象存档或删除。您可为不同前缀创建多个规则。最后,您可以使用生命周期策略使未完成的上传任务自动过期,从而防止上传部分文件的操作产生费用。
问:如何将对象配置为在特定时间段之后删除?
您可以设置生命周期过期策略,在指定天数之后将对象从您的存储桶中删除。您可以通过应用于存储桶的生命周期配置策略,为位于您的存储桶中的一组对象定义过期规则。通过每条对象过期规则,您可以指定前缀和过期时段。前缀字段用于标识要遵守规则的对象。要将规则应用于单个对象,请指定键名称。要将规则应用于一组对象,请指定它们的共同前缀(如“logs/”)。对于过期时段,请提供从创建日期之日开始的天数(即寿命),超过这个天数之后,该对象将被删除。您可为不同前缀创建多个规则。例如,您可以创建一条规则,将具有“logs/”前缀的所有对象在创建 30 天之后删除,然后另外创建一条单独规则,将具有“backups/”前缀的所有对象在创建 90 天之后删除。
添加对象过期规则之后,该规则被应用于已存在于存储桶中的对象以及添加到存储桶中的新对象。一旦对象超过它们的过期日期,系统将对它们进行标识,并按队列将其删除。对于达到或超出过期日期的对象的存储,我们不会向您收取费用,当对象删除之前在队列中等待时,您仍然可以访问这些对象。对于标准删除请求,Amazon S3 不会因为您使用对象过期功能来删除对象而向您收取费用。您也可以为版本控制已启用或已暂停的存储桶设置过期规则。
问:为什么要使用生命周期策略让未完成的分段上传过期?
如果使用生命周期策略让未完成的分段上传过期,您可以通过限制未完成的分段上传的存储时间来帮助您节省成本。例如,如果您的应用程序上传了若干分段对象部分,但从未提交,那么您仍然需要为其存储付费。此策略可在预定义的天数后自动移除未完成的分段上传及其相关存储,从而降低您的 S3 存储费用。
复制
问:什么是 Amazon S3 复制?
Amazon S3 复制支持跨 Amazon S3 存储桶自动以异步方式复制对象。为对象复制配置的存储桶可以由同一 AWS 账户或不同账户拥有。您可以跨不同 AWS 中国区域(S3 跨区域复制)或在同一 AWS 区域内(S3 相同区域复制)将对象复制到一个或多个目标存储桶。
问:什么是 Amazon S3 跨区域复制 (CRR)?
CRR 是 Amazon S3 的一项功能,可在不同 AWS 中国区域的存储桶之间自动复制数据。借助 CRR,您可以使用 S3 对象标签在存储桶级别、共享前缀级别或对象级别设置复制。您可以使用 CRR 向 AWS 中国区域内的用户提供延迟更低的数据访问。如果您需要遵循将数据副本存储在相距数百英里远的位置的合规性要求,CRR 还可以帮助您达成这一目标。您可以使用 CRR 更改复制对象的账户所有权,以防止数据被意外删除。要了解有关 CRR 的更多信息,请访问复制开发人员指南。
问:什么是 Amazon S3 相同区域复制 (SRR)?
CRR 是 Amazon S3 的一项功能,可在同一 AWS 区域的存储桶之间自动复制数据。借助 SRR,您可以使用 S3 对象标签在存储桶级别、共享前缀级别或对象级别设置复制。您可以使用 SRR 在同一 AWS 区域中创建数据的一个或多个副本。SRR 通过将数据副本保存在与原始账户相同区域的单独 AWS 账户中,帮助您满足数据主权和合规性要求。您可以使用 SRR 更改复制对象的账户所有权,以防止数据被意外删除。您还可以使用 SRR 轻松聚合来自不同 S3 存储桶的日志以进行区域内处理,或配置测试和开发环境之间的实时复制。要了解有关 SRR 的更多信息,请访问复制开发人员指南。
问:如何启用 Amazon S3 复制(跨区域复制和相同区域复制)?
您可以使用 S3 对象标签在 S3 存储桶级别、共享前缀级别或对象级别配置 Amazon S3 复制。您可以在相同或不同 AWS 中国区域中指定目标存储桶用于复制,这样就可以对来源存储桶添加复制配置。
您可以使用 S3 管理控制台、API、AWS CLI、AWS 软件开发工具包或 AWS CloudFormation 来启用复制。要启用复制,必须同时为来源存储桶和目标存储桶启用版本控制。
问:是否可以将 S3 复制(CRR 与 SRR)与 S3 生命周期规则结合使用?
使用 S3 复制(CRR 和 SRR),您可以建立复制规则,将对象的副本复制到中国境内同一区域或不同区域的另一个存储类中。生命周期操作不会被复制,如果您想将相同的生命周期配置应用于来源存储桶和目标存储桶,请为两者启用相同的生命周期配置。
例如,您可以配置一个生命周期规则,将数据从 S3 标准存储类迁移到目标存储桶上的 S3 标准 – IA。
您可以在 S3 复制开发人员指南中找到有关生命周期配置和复制的更多信息。
**问:是否可以使用 S3 复制复制到多个目标存储桶?
**
可以。S3 复制使客户可以将其数据复制到相同或不同 AWS 中国区域中的多个目标存储桶。设置时,您只需在现有复制配置中指定新的目标存储桶,或创建具有多个目标存储桶的新复制配置。对于指定的每个新目标,您可以灵活地选择目标存储桶的存储类、加密类型、复制指标和通知以及其他属性。
**问:是否可以使用 S3 复制在 S3 存储桶之间设置双向复制?
**
可以。要设置双向复制,请创建一个从 S3 存储桶 A 到 S3 存储桶 B 的复制规则,并设置另一个从 S3 存储桶 B 到 S3 存储桶 A 的复制规则。设置从 S3 存储桶 B 到 S3 存储桶 A 的复制规则时,请启用“同步副本修改”,以复制副本元数据更改。借助副本修改同步,您可以轻松地复制元数据更改,例如对象访问控制列表 (ACL)、对象标签或复制对象上的对象锁。
问:在整个复制过程中,对象是否可以安全传输和加密?
可以。在整个复制过程中,对象都保持加密状态。加密对象通过 SSL 从来源区域安全地传输到目标区域 (CRR) 或相同区域 (SRR) 中。
问:能否跨 AWS 中国账户使用复制来防止恶意或意外删除?
能。对于 CRR 和 SRR,您可以跨 AWS 中国账户设置复制,以将复制的数据存储在目标区域的不同账户中。您可以在复制配置中使用所有权覆盖来维护来源和目标之间的不同所有权堆栈,并将目标账户所有权授予复制的存储。
问:是否可以将删除标记从一个存储桶复制到另一个存储桶?
可以。如果您已在复制配置中启用了删除标记复制,则可以将删除标记从源存储桶复制到目标存储桶。复制删除标记时,Amazon S3 的行为就像在两个存储桶中都删除了对象一样。您可以为新的或现有的复制规则启用删除标记复制。您可以使用基于前缀的复制规则,将删除标记复制应用于整个存储桶或具有特定前缀的 Amazon S3 对象。Amazon S3 复制不支持基于对象标签的复制规则的删除标记复制。要了解有关启用删除标记复制的更多信息,请参阅将删除标记从一个存储桶复制到另一个存储桶。
问:什么是 Amazon S3 复制指标和事件?
Amazon S3 复制指标和事件提供了对 Amazon S3 复制的可见性。使用 S3 复制指标,您可以监控待复制的操作总数和对象大小,以及每个 S3 复制规则的源存储桶和目标存储桶之间的复制延迟。您可以通过 Amazon S3 管理控制台和 Amazon CloudWatch 获得复制指标。如果复制失败,S3 复制事件将通知您,以便您可以快速诊断和更正问题。 与其他 Amazon S3 事件一样,S3 复制事件可通过 Amazon Simple Queue Service (Amazon SQS)、Amazon Simple Notification Service (Amazon SNS) 或 AWS Lambda 获取。
问:如何启用 Amazon S3 复制指标和事件?
您可以为每个新的或现有的复制规则启用 Amazon S3 复制指标和事件。您可以通过 Amazon S3 管理控制台和 Amazon CloudWatch 访问 S3 复制指标。与其他 Amazon S3 事件一样,S3 复制事件可通过 Amazon Simple Queue Service (Amazon SQS)、Amazon Simple Notification Service (Amazon SNS) 或 AWS Lambda 获取。要了解更多信息,请访问《Amazon S3 开发人员指南》中的使用复制指标和 Amazon S3 事件通知监控进度。
问:是否可以将数据从其他 AWS 区域复制到中国? 客户是否可以将数据从中国区域的存储桶复制到中国境外的区域?
不可以。Amazon S3 复制在 AWS 中国区域与中国境外的 AWS 区域之间不可用。您只能在 AWS 中国区域内进行复制。
问:S3 复制(CRR 和 SRR)如何定价?
您需要为 Amazon S3 的存储和复制请求付费,对于 CRR,您需要为传出到目标区域的数据复制副本的区域间传输付费。复制请求和区域间数据传输的费用根据来源区域而定。复制数据存储的费用根据目标区域而定。如果源对象是通过分段上传功能上传的,则使用相同数量的段和段大小进行复制。例如,通过分段上传功能上传的 100GB 对象(800 个段,每段 128MB)在复制时会产生与 802 个请求(800 个上传段请求 + 1 个初始分段上传请求 + 1 个完成分段上传请求)关联的请求成本。复制后,该 100GB 数据会产生基于目标区域的存储费用。请访问 S3 定价页面了解定价信息。
就地查询
S3 Select
问:什么是 S3 Select?
S3 Select 是 Amazon S3 的一项功能,让您可以轻松使用简单的 SQL 表达式检索对象内容中的具体数据,而无需检索整个对象。您可以利用 S3 Select,在 Amazon S3 中使用 SQL 语句(例如 SELECT 和 WHERE)检索带分隔符的文本文件和 JSON 对象内的数据子集。
问:S3 Select 可以用来做什么?
借助 S3 Select,您可以使用简单的 SQL 语句检索对象中较小且具有针对性的数据集。您可以结合使用 S3 Select 与 AWS Lambda 来构建无服务器应用程序,此类应用程序能够使用 S3 Select 有效且轻松地检索 Amazon S3 中的数据,而不是检索和处理整个对象。您也可以结合使用 S3 Select 与大数据框架(如 Presto、Apache Hive 和 Apache Spark)来扫描和筛选 Amazon S3 中的数据。
问:为什么要使用 S3 Select?
借助 S3 Select,您可以通过全新方式使用 SQL 语句从存储在 Amazon S3 中的对象内容检索具体数据,无需检索整个对象。S3 Select 简化了扫描对象内容并将其筛选成更小且具有针对性的数据集的流程,将这一性能提升高达 400%。借助 S3 Select,您还可以对 Amazon S3 中的日志文件执行操作调查,无需操作或管理计算集群。