前言
编程竞赛,尤其是算法竞赛,一直是计算机科学领域中的精彩领域之一。无论你是准备参加ACM竞赛、Google Code Jam,还是仅仅为了提高自己的编程技能,本笔记将为你提供Python算法竞赛的基础知识和技巧。
Python是一种广泛使用的编程语言,具有直观的语法和强大的标准库。本笔记将介绍Python中的基本语法、控制流、数据结构、算法、输入输出、常用模块、调试技巧以及实战演练。从基础知识到高级算法,你将逐步掌握参加算法竞赛所需的核心概念和技能。
文章目录
- 前言
- Python算法竞赛基础知识笔记
- 1. 基本语法
- 1.1 注释
- 1.2 变量和数据类型
- 1.2.1数据类型
- 1.2.2变量命名规则
- 2. 控制流程
- 2.1 条件语句
- 2.2 控制流程
- 2.2.1条件语句
- 2.2.1循环语句
- 2.2.1.1for循环
- 2.2.1.2while循环
- 3. 函数
- 4. 异常处理
- 5. 数据结构
- 5.1 列表
- 5.2 元组
- 5.3 集合
- 5.4 字典
- 6. 算法
- 6.1 排序算法
- 6.1.1 冒泡排序
- 6.1.2 选择排序
- 6.1.3 插入排序
- 6.1.4 快速排序
- 6.2 查找算法
- 6.2.1 线性查找
- 6.2.2 二分查找
- 7. 图论算法
- 7.1 深度优先搜索(DFS)
- 7.2 广度优先搜索(BFS)
- 7.3 最短路径算法
- 7.3.1 Dijkstra算法
- 7.3.2 Floyd算法
- 7.4 最小生成树算法
- 7.4.1 Kruskal算法
- 7.4.2 Prim算法
- 8. 动态规划算法
- 8.1 背包问题
- 8.1.1 0/1背包问题
- 8.1.2 分数背包问题
- 8.2 最长公共子序列(LCS)
- 8.3 最长递增子序列(LIS)
- 9. 输入输出
- 9.1 单样例输入
- 9.2 多样例输入
- 9.2.1 多样例输入,无明确样例个数
- 9.2.2 要输入N行
- 9.2.3 多样例输入,指定结束符号
- 9.2.4 输入N组,指定结束符号
- 9.3 多样例复杂输入
- 9.3.1 多样例输入,无明确样例个数
- 9.3.2 要输入N行
- 9.4 特殊输入情况
- 9.4.1 多行多值输入
- 9.4.2 字符串输入和处理
- 9.4.3 大量输入数据的优化
- 9.5 输出格式控制
- 9.5.1 四舍五入
- 9.5.2 小数精度控制
- 9.5.3 输出重定向到文件
- 9.6 异常处理
- 9.6.1 输入结束
- 9.6.2 错误情况
- 10. 常用模块
- 10.1 sys模块
- 10.1.1 处理命令行参数
- 10.1.2 标准输入输出
- 10.1.3 异常处理
- 10.2 math模块
- 10.2.1 常数
- 10.2.2 数学函数
- 10.2.3 数学运算
- 10.3 random模块
- 10.3.1 随机数生成
- 10.3.2 随机序列操作
- 10.3.3 随机种子
- 10.4 字符串处理模块
- 10.4.1 `re`模块
- 10.4.2 `string`模块
- 10.5 时间模块
- 10.5.1 `datetime`模块
- 10.5.2 `time`模块
- 10.6 数据结构模块
- 10.6.1 `collections`模块
- 10.6.2 `heapq`模块
- 10.7 文件操作模块
- 10.7.1 `os`模块
- 10.7.2 `shutil`模块
- 10.8 网络操作模块
- 10.8.1 `requests`模块
- 10.8.2 `socket`模块
- 10.9 其他工具模块
- 10.9.1 `itertools`模块
- 10.9.2 `json`模块
- 11. 调试技巧
- 11.1 print语句
- 11.1.1 输出变量值
- 11.1.2 输出中间结果
- 11.1.3 跟踪代码执行
- 11.2 断言语句
- 11.2.1 检查前提条件
- 11.2.2 调试问题代码
- 11.3 调试器
- 11.3.1 启动调试器
- 11.3.2 调试命令
- 11.3.3 交互式调试
- 12. `functools.lru_cache`装饰器
- 12.1 使用`functools.lru_cache`
- 12.2 使用示例
- 12.3 使用场景
- 12.4 注意事项
- 总结
Python算法竞赛基础知识笔记
1. 基本语法
1.1 注释
Python中单行注释使用 #
符号,多行注释使用三个引号('''
或"""
)。
# 这是一个单行注释
'''
这是一个
多行注释
'''
"""
这也是一个
多行注释
"""
1.2 变量和数据类型
1.2.1数据类型
- 数字:整数、浮点数、复数
- 字符串:用单引号(
'
)或双引号("
)括起来的文本 - 列表:用方括号(
[]
)括起来的值的有序集合 - 元组:用圆括号(
()
)括起来的值的有序集合;与列表相似,但元素不能更改 - 集合:无序且不重复的值的集合,用大括号(
{}
)或者set()
函数创建 - 字典:用大括号(
{}
)括起来的键-值对的无序集合
1.2.2变量命名规则
- 变量名只能包含字母、数字和下划线。变量名可以以字母或下划线开头,但不能以数字开头。
- Python变量名区分大小写。
- 变量名应该描述它所包含的数据的含义。
# 声明字符串变量
name = "Tom"
# 声明整型变量
age = 28
# 声明浮点型变量
score = 95.5
# 声明布尔型变量
is_passed = True
# 声明列表
fruits = ['apple', 'banana', 'orange']
# 声明元组
point = (2, 3)
# 声明集合
set1 = {1, 2, 3}
# 声明字典
person = {'name': 'Tom', 'age': 28}
2. 控制流程
2.1 条件语句
条件语句用于根据条件执行不同的代码块。
if x > 0:
print("x是正数")
elif x == 0:
print("x是零")
else:
print("x是负数")
2.2 控制流程
2.2.1条件语句
if condition1:
statement1
elif condition2:
statement2
else:
statement3
2.2.1循环语句
2.2.1.1for循环
for variable in sequence:
statement
-
range(start, stop[, step])
函数生成一个从start
到stop-1
的整数序列,步长为step
。
# 遍历列表
fruits = ['apple', 'banana', 'orange']
for fruit in fruits:
print(fruit)
# 使用range函数遍历整数序列
for i in range(1, 10, 2):
print(i)
2.2.1.2while循环
while condition:
statement
# 计算1到10的和
sum = 0
i = 1
while i <= 10:
sum += i
i += 1
print(sum)
3. 函数
def function_name(parameters):
statement
return expression
-
parameters
表示函数的参数,多个参数之间用逗号分隔。 - 函数执行完毕后可以返回一个值,使用
return
语句返回一个表达式。
# 定义一个计算斐波那契数列的函数
def fibonacci(n):
if n <= 0:
return None
if n == 1:
return [0]
if n == 2:
return [0, 1]
fib = [0, 1]
for i in range(2, n):
fib.append(fib[i - 1] + fib[i - 2])
return fib
4. 异常处理
在Python中,异常是指一个事件,它会导致程序在执行过程中停止正常的流程,并且程序没有处理这个事件。可以使用try-except
语句来捕获和处理异常。
try:
statement
except ExceptionType as e:
handler
-
statement
表示可能会抛出异常的代码块。 - 如果
statement
抛出ExceptionType
类型的异常,则跳转到handler
代码块,进行异常处理。 -
as
关键字用于指定异常对象的名称。
# 捕获除数为零的异常
try:
result = 10 / 0
except ZeroDivisionError as e:
print("Error: ", e)
5. 数据结构
5.1 列表
列表是Python中最常见的数据结构之一,它是一个有序的集合,可以存储不同类型的元素。
# 声明一个空列表
empty_list = []
# 声明带有元素的列表
fruits = ['apple', 'banana', 'orange']
# 访问列表元素
print(fruits[0]) # 输出: apple
# 修改列表元素
fruits[1] = 'pear'
print(fruits) # 输出: ['apple', 'pear', 'orange']
# 添加元素
fruits.append('grape')
print(fruits) # 输出: ['apple', 'pear', 'orange', 'grape']
# 删除元素
del fruits[2]
print(fruits) # 输出: ['apple', 'pear', 'grape']
5.2 元组
元组是一个不可变的有序集合,与列表类似,但元素不能更改。
# 声明一个元组
point = (2, 3)
# 访问元组元素
print(point[0]) # 输出: 2
# 尝试修改元组元素,抛出TypeError异常
point[0] = 5
5.3 集合
集合是无序的数据结构,用于存储不重复的元素。
# 声明一个集合
set1 = {1, 2, 3}
# 添加元素
set1.add(4)
print(set1) # 输出: {1, 2, 3, 4}
# 删除元素
set1.remove(2)
print(set1) # 输出: {1, 3, 4}
5.4 字典
字典是一个无序的键-值对集合。
# 声明一个字典
person = {'name': 'Tom', 'age': 28}
# 访问字典元素
print(person['name']) # 输出: Tom
# 修改字典元素
person['age'] = 30
print(person) # 输出: {'name': 'Tom', 'age': 30}
# 添加元素
person['gender'] = 'male'
print(person) # 输出: {'name': 'Tom', 'age': 30, 'gender': 'male'}
# 删除元素
del person['gender']
print(person) # 输出: {'name': 'Tom', 'age': 30}
6. 算法
6.1 排序算法
6.1.1 冒泡排序
冒泡排序是一种简单的排序算法,它多次遍历列表,比较相邻元素并交换它们。
def bubble_sort(arr):
n = len(arr)
for i in range(n):
for j in range(0, n - i - 1):
if arr[j] > arr[j + 1]:
arr[j], arr[j + 1] = arr[j + 1], arr[j]
6.1.2 选择排序
选择排序是一种不稳定的排序算法,它每次选择未排序部分的最小元素并将其放在已排序部分的末尾。
def selection_sort(arr):
n = len(arr)
for i in range(n):
min_idx = i
for j in range(i + 1, n):
if arr[j] < arr[min_idx]:
min_idx = j
arr[i], arr[min_idx] = arr[min_idx], arr[i]
6.1.3 插入排序
插入排序将元素逐个插入到已排序部分的正确位置,适用于小型列表。
def insertion_sort(arr):
for i in range(1, len(arr)):
key = arr[i]
j = i - 1
while j >= 0 and key < arr[j]:
arr[j + 1] = arr[j]
j -= 1
arr[j + 1] = key
6.1.4 快速排序
快速排序是一种高效的排序算法,通过分治法将列表分成较小的子列表,并逐渐排序它们。
def quick_sort(arr):
if len(arr) <= 1:
return arr
pivot = arr[len(arr) // 2]
left = [x for x in arr if x < pivot]
middle = [x for x in arr if x == pivot]
right = [x for x in arr if x > pivot]
return quick_sort(left) + middle + quick_sort(right)
6.2 查找算法
6.2.1 线性查找
线性查找遍历列表以查找特定元素。
def linear_search(arr, target):
for i in range(len(arr)):
if arr[i] == target:
return i
return -1
6.2.2 二分查找
二分查找适用于有序列表,它通过将列表分成两半来查找特定元素。
def binary_search(arr, target):
left, right = 0, len(arr) - 1
while left <= right:
mid = left + (right - left) // 2
if arr[mid] == target:
return mid
elif arr[mid] < target:
left = mid + 1
else:
right = mid - 1
return -1
7. 图论算法
7.1 深度优先搜索(DFS)
深度优先搜索是一种图遍历算法,从起始节点出发,尽可能深地探索每个分支,然后回溯到上一层。
"""
NAME : dfs
USER : admin
DATE : 10/11/2023
PROJECT_NAME : README.md
CSDN : friklogff
"""
# 定义一个无向图的邻接列表表示
graph = {
'A': ['B', 'C'],
'B': ['A', 'D', 'E'],
'C': ['A', 'F'],
'D': ['B'],
'E': ['B', 'F'],
'F': ['C', 'E']
}
def dfs(graph, node, visited):
if node not in visited:
print(node, end=' ')
visited.add(node)
for neighbor in graph[node]:
dfs(graph, neighbor, visited)
# 执行DFS
start_node = 'A'
visited = set() # 用于存储已经访问过的节点
print("DFS starting from node", start_node)
dfs(graph, start_node, visited)
7.2 广度优先搜索(BFS)
广度优先搜索也是一种图遍历算法,从起始节点开始,依次探索相邻节点,然后向下一层移动。
"""
NAME : bfs
USER : admin
DATE : 10/11/2023
PROJECT_NAME : README.md
CSDN : friklogff
"""
from collections import deque
# 定义一个无向图的邻接列表表示
graph = {
'A': ['B', 'C'],
'B': ['A', 'D', 'E'],
'C': ['A', 'F'],
'D': ['B'],
'E': ['B', 'F'],
'F': ['C', 'E']
}
def bfs(graph, start):
visited = set() # 用于存储已经访问过的节点
queue = deque() # 用于存储待访问的节点
visited.add(start) # 将起始节点加入已访问集合
queue.append(start) # 将起始节点加入队列
while queue:
node = queue.popleft() # 从队列中取出一个节点
print(node, end=' ')
# 遍历该节点的邻居节点
for neighbor in graph[node]:
if neighbor not in visited:
visited.add(neighbor)
queue.append(neighbor)
# 从节点'A'开始执行BFS
start_node = 'A'
print("BFS starting from node", start_node)
bfs(graph, start_node)
7.3 最短路径算法
7.3.1 Dijkstra算法
Dijkstra算法用于找到带权重图中的单源最短路径。
"""
NAME : dijkstra
USER : admin
DATE : 10/11/2023
PROJECT_NAME : README.md
CSDN : friklogff
"""
import heapq
# 定义一个加权有向图的邻接列表表示
graph = {
'A': {'B': 1, 'C': 4},
'B': {'A': 1, 'D': 2, 'E': 7},
'C': {'A': 4, 'F': 5},
'D': {'B': 2},
'E': {'B': 7, 'F': 3},
'F': {'C': 5, 'E': 3}
}
def dijkstra(graph, start):
# 创建一个字典来存储从起始节点到其他节点的最短距离
distances = {node: float('inf') for node in graph}
distances[start] = 0
# 创建一个优先队列(最小堆),用于按距离排序节点
priority_queue = [(0, start)]
while priority_queue:
current_distance, current_node = heapq.heappop(priority_queue)
# 如果当前节点的距离大于已知的最短距离,跳过
if current_distance > distances[current_node]:
continue
# 遍历当前节点的邻居节点
for neighbor, weight in graph[current_node].items():
distance = current_distance + weight
# 如果通过当前节点到邻居节点的距离更短,更新距离
if distance < distances[neighbor]:
distances[neighbor] = distance
heapq.heappush(priority_queue, (distance, neighbor))
return distances
# 执行Dijkstra算法
start_node = 'A'
shortest_distances = dijkstra(graph, start_node)
# 输出从起始节点到每个节点的最短距离
for node, distance in shortest_distances.items():
print(f'Shortest distance from {start_node} to {node} is {distance}')
7.3.2 Floyd算法
Floyd算法用于找到图中所有节点之间的最短路径。
"""
"""
NAME : floyd
USER : admin
DATE : 10/11/2023
PROJECT_NAME : README.md
CSDN : friklogff
"""
# 定义一个有向带权图的邻接矩阵表示,使用无穷大表示不可达
inf = float('inf')
graph = [
[0, inf, 3, inf, inf],
[2, 0, inf, inf, 1],
[inf, inf, 0, 5, inf],
[inf, inf, inf, 0, 2],
[inf, 6, inf, inf, 0]
]
def floyd_warshall(graph):
num_nodes = len(graph)
# 初始化距离矩阵
distances = [row[:] for row in graph]
for k in range(num_nodes):
for i in range(num_nodes):
for j in range(num_nodes):
if distances[i][k] + distances[k][j] < distances[i][j]:
distances[i][j] = distances[i][k] + distances[k][j]
return distances
# 执行Floyd-Warshall算法
shortest_distances = floyd_warshall(graph)
# 输出所有节点对之间的最短距离
num_nodes = len(graph)
for i in range(num_nodes):
for j in range(num_nodes):
print(f'Shortest distance from node {i} to node {j} is {shortest_distances[i][j]}')
7.4 最小生成树算法
7.4.1 Kruskal算法
Kruskal算法用于找到无向带权图的最小生成树。
"""
"""
NAME : Kruskal
USER : admin
DATE : 10/11/2023
PROJECT_NAME : README.md
CSDN : friklogff
"""
# 定义一个带权的无向图的边集合,每个边表示为(节点1, 节点2, 权重)
edges = [
('A', 'B', 1),
('A', 'C', 4),
('B', 'D', 2),
('B', 'E', 7),
('C', 'F', 5),
('E', 'F', 3)
]
def kruskal(graph):
def find(parent, node):
if parent[node] != node:
parent[node] = find(parent, parent[node])
return parent[node]
def union(parent, rank, node1, node2):
root1 = find(parent, node1)
root2 = find(parent, node2)
if root1 != root2:
if rank[root1] < rank[root2]:
parent[root1] = root2
elif rank[root1] > rank[root2]:
parent[root2] = root1
else:
parent[root2] = root1
rank[root1] += 1
edges.sort(key=lambda edge: edge[2]) # 按权重升序排序边
minimum_spanning_tree = []
parent = {}
rank = {}
for node1, node2, weight in edges:
if node1 not in parent:
parent[node1] = node1
rank[node1] = 0
if node2 not in parent:
parent[node2] = node2
rank[node2] = 0
if find(parent, node1) != find(parent, node2):
minimum_spanning_tree.append((node1, node2, weight))
union(parent, rank, node1, node2)
return minimum_spanning_tree
# 执行Kruskal算法
minimum_spanning_tree = kruskal(edges)
# 输出最小生成树的边和权重
print("Minimum Spanning Tree:")
for edge in minimum_spanning_tree:
print(f"{edge[0]} - {edge[1]}: {edge[2]}")
7.4.2 Prim算法
Prim算法也用于找到无向带权图的最小生成树。
"""
"""
NAME : Prim
USER : admin
DATE : 10/11/2023
PROJECT_NAME : README.md
CSDN : friklogff
"""
# 定义一个带权的无向图的邻接列表表示
graph = {
'A': [('B', 1), ('C', 4)],
'B': [('A', 1), ('D', 2), ('E', 7)],
'C': [('A', 4), ('F', 5)],
'D': [('B', 2)],
'E': [('B', 7), ('F', 3)],
'F': [('C', 5), ('E', 3)]
}
def prim(graph):
# 选择一个起始节点
start_node = list(graph.keys())[0]
# 创建一个集合用于存储已经包含在最小生成树中的节点
included_nodes = set()
# 创建一个列表用于存储最小生成树的边
minimum_spanning_tree = []
# 将起始节点添加到已包含的节点中
included_nodes.add(start_node)
while len(included_nodes) < len(graph):
min_edge = None
for node in included_nodes:
for neighbor, weight in graph[node]:
if neighbor not in included_nodes:
if min_edge is None or weight < min_edge[2]:
min_edge = (node, neighbor, weight)
if min_edge:
minimum_spanning_tree.append(min_edge)
included_nodes.add(min_edge[1])
return minimum_spanning_tree
# 执行Prim算法
minimum_spanning_tree = prim(graph)
# 输出最小生成树的边和权重
print("Minimum Spanning Tree:")
for edge in minimum_spanning_tree:
print(f"{edge[0]} - {edge[1]}: {edge[2]}")
8. 动态规划算法
动态规划是一种优化问题的常用方法,通常用于解决重叠子问题的情况,以减少重复计算。
8.1 背包问题
背包问题是一个经典的动态规划问题,通常分为0/1背包问题和分数背包问题。
8.1.1 0/1背包问题
0/1背包问题要求在限定重量的情况下,选择物品以获得最大价值。
def knapsack_01(weights, values, capacity):
n = len(weights)
dp = [[0] * (capacity + 1) for _ in range(n + 1)]
for i in range(1, n + 1):
for w in range(capacity + 1):
if weights[i - 1] <= w:
dp[i][w] = max(dp[i - 1][w], dp[i - 1][w - weights[i - 1]] + values[i - 1])
else:
dp[i][w] = dp[i - 1][w]
return dp[n][capacity]
8.1.2 分数背包问题
分数背包问题允许部分取物品,目标是最大化总价值。
def fractional_knapsack(weights, values, capacity):
n = len(weights)
items = list(zip(weights, values, [v / w for v, w in zip(values, weights)]))
items.sort(key=lambda x: x[2], reverse=True)
max_value = 0
for w, v, ratio in items:
if capacity >= w:
max_value += v
capacity -= w
else:
max_value += ratio * capacity
break
return max_value
8.2 最长公共子序列(LCS)
最长公共子序列问题用于找到两个序列中的最长公共子序列。
def lcs(X, Y):
m = len(X)
n = len(Y)
dp = [[0] * (n + 1) for _ in range(m + 1)]
for i in range(1, m + 1):
for j in range(1, n + 1):
if X[i - 1] == Y[j - 1]:
dp[i][j] = dp[i - 1][j - 1] + 1
else:
dp[i][j] = max(dp[i - 1][j], dp[i][j - 1])
return dp[m][n]
8.3 最长递增子序列(LIS)
最长递增子序列问题要找到一个序列中的最长子序列,该子序列在原始序列中的顺序递增。
def lis(nums):
n = len(nums)
dp = [1] * n
for i in range(1, n):
for j in range(i):
if nums[i] > nums[j]:
dp[i] = max(dp[i], dp[j] + 1)
return max(dp)
9. 输入输出
9.1 单样例输入
在ACM竞赛中,单样例输入通常是只需一行输入的情况。以下是一个示例Python 3代码,用于对10个整数从小到大排序:
numbers = list(map(int, input().split()))
numbers.sort()
for num in numbers:
print(num, end=' ')
这段代码首先将输入拆分为整数列表,然后对列表进行排序,并将结果逐行输出。
9.2 多样例输入
9.2.1 多样例输入,无明确样例个数
有时候,ACM竞赛中有多组输入数据,但没有具体的告诉你有多少组。你需要在每组输入后输出相应的结果。以下是一个示例,对两个整数求和:
while True:
try:
a, b = map(int, input().strip().split())
print(a + b)
except EOFError:
break
这段代码不断尝试从输入中获取整数对,计算它们的和,并将结果逐行输出,直到遇到文件结束(EOF)。
9.2.2 要输入N行
有时,你会知道有多组数据,并且需要在输入每组数据的具体值。以下是一个示例,计算学生的平均成绩和最高分学生的数据:
num_students = int(input().strip())
def is_numeric(x):
if ord(x[0]) < 90: # 判断是数字还是字母
return int(x)
return x
data = [list(map(is_numeric, input().split())) for i in range(num_students)]
average = sum([x[2] for x in data]) / num_students
print(int(average), end=' ')
max_score_student = max(data, key=lambda x: sum(x[2:]))
print(*max_score_student)
这段代码首先获取学生的数量,然后输入每个学生的数据。它计算了平均成绩和最高分学生的数据,并以指定格式输出。
9.2.3 多样例输入,指定结束符号
有时,多组输入数据没有明确告诉你有多少组,但题目却告诉你遇见什么结束。以下是一个示例,计算整数对的和,直到遇到输入0 0:
while True:
a, b = map(int, input().strip().split())
if a == 0 and b == 0:
break
print(a + b)
这段代码不断尝试从输入中获取整数对,计算它们的和,并将结果逐行输出,直到遇到输入0 0。
9.2.4 输入N组,指定结束符号
有时,输入有N组,并且题目告诉你每组输入遇见什么结束。以下是一个示例,计算整数对的和,直到遇到输入0 0:
num_cases = int(input().strip())
for case in range(num_cases):
a, b = map(int, input().strip().split())
if a == 0 and b == 0:
break
print(a + b)
这段代码首先获取案例的数量,然后输入每组案例的数据。它计算了整数对的和,直到遇到输入0 0,然后终止。
9.3 多样例复杂输入
9.3.1 多样例输入,无明确样例个数
有时,会有多种输入数据,对于每组输入数据的第一个数代表该组数据接下来要输入多少数据。以下是一个示例,计算每组输入的和:
while True:
try:
data = list(map(int, input().strip().split()))
num_inputs, values = data[0], data[1:]
total = sum(values)
print(total)
except EOFError:
raise
这段代码不断尝试从输入中获取每组数据的信息,计算它们的和,并将结果逐行输出,直到遇到文件结束(EOF)。
9.3.2 要输入N行
有时,你会知道有多少行数据,然后输入每一行。以下是一个示例,计算每组输入的和:
num_cases = int(input().strip())
for case in range(num_cases):
data = list(map(int, input().strip().split()))
num_inputs, values = data[0], data[1:]
total = sum(values)
print(total)
这段代码首先获取案例的数量,然后输入每组案例的数据。它计算了每组输入的和,并将结果逐行输出。
9.4 特殊输入情况
在ACM竞赛中,有时会遇到特殊的输入情况,需要根据具体问题进行处理。以下是一些示例和相应的代码来处理特殊输入情况:
9.4.1 多行多值输入
有时,题目可能要求你处理多行多值输入,例如一行中包含多个整数或字符串,每行代表不同的数据。以下是一个示例,计算每行整数的和:
while True:
try:
line = input().strip()
if not line:
break
values = list(map(int, line.split()))
total = sum(values)
print(total)
except EOFError:
raise
这段代码通过逐行获取输入,将每行的值拆分为整数列表,计算它们的和,并将结果逐行输出。当遇到空行时结束。
9.4.2 字符串输入和处理
有时,输入可能是字符串,而不是简单的整数或浮点数。你需要根据字符串的内容进行处理。以下是一个示例,统计字符串中的单词数:
while True:
try:
line = input().strip()
if not line:
break
words = line.split()
word_count = len(words)
print(word_count)
except EOFError:
raise
这段代码逐行获取输入,将每行的字符串拆分为单词,然后统计单词数,并将结果逐行输出。当遇到空行时结束。
9.4.3 大量输入数据的优化
在某些情况下,输入数据可能非常庞大,需要考虑如何进行优化以提高代码的效率。以下是一个示例,处理大量整数求和:
total = 0
while True:
try:
line = input().strip()
if not line:
break
value = int(line)
total += value
except EOFError:
raise
print(total)
这段代码逐行获取输入,将每行的整数值累加到total
变量中,最后输出总和。这种方式可以有效处理大量输入数据,而无需保存所有输入值。
9.5 输出格式控制
在某些情况下,你需要控制输出的格式,包括四舍五入和小数精度控制。你还可以将输出重定向到文件。以下是一些示例和代码来控制输出格式:
9.5.1 四舍五入
如果需要对浮点数进行四舍五入,可以使用内置的round()
函数。以下是一个示例,将浮点数四舍五入到两位小数:
value = 3.14159265359
rounded_value = round(value, 2)
print(rounded_value)
这段代码将value
四舍五入到两位小数,并将结果输出。
9.5.2 小数精度控制
如果需要控制输出的小数精度,可以使用字符串格式化。以下是一个示例,将浮点数输出为指定小数精度的字符串:
value = 3.14159265359
formatted_value = "{:.2f}".format(value)
print(formatted_value)
这段代码使用字符串格式化将value
输出为两位小数的字符串。
9.5.3 输出重定向到文件
如果需要将输出保存到文件而不是标准输出,可以使用文件重定向。以下是一个示例,将输出重定向到文件:
with open("output.txt", "w") as f:
print("Hello, World!", file=f)
这段代码将文本输出到名为"output.txt"的文件中。
9.6 异常处理
在编写竞赛代码时,应考虑如何处理可能的异常,如输入结束和错误情况。这可以确保代码在各种情况下都能正常运行。使用try
和except
语句可以捕获异常并采取相应的措施,以确保程序不会中断。
在竞赛中,以下是一些常见的异常处理情况和相应的处理方法:
9.6.1 输入结束
在处理输入数据时,你可能会遇到输入结束的情况,特别是在使用while
循环读取输入时。使用try
和except
语句来捕获EOFError
异常,以便正常退出循环。
while True:
try:
# 读取输入
except EOFError:
break # 输入结束,退出循环
9.6.2 错误情况
有时,输入数据可能不符合预期的格式,可能会导致程序出现错误。你可以使用异常处理来捕获这些错误情况并采取相应的措施,如输出错误信息或跳过错误的输入。
while True:
try:
# 读取输入
# 处理输入数据
except ValueError:
print("输入数据格式错误,跳过该输入")
except Exception as e:
print(f"发生未知错误:{e}")
通过使用适当的异常处理,你可以确保即使在面对不完美的输入数据时,程序也能继续运行,而不会崩溃。
10. 常用模块
Python提供了许多内置模块,这些模块包含了各种有用的功能和工具,可以用来解决不同领域的问题。在竞赛编程中,一些常用的模块可以帮助你更轻松地处理输入、进行数学计算以及生成随机数等。以下是一些常用模块的简介:
10.1 sys模块
sys
模块提供了与Python解释器和系统交互的功能。在竞赛编程中,它通常用于处理命令行参数、标准输入输出以及异常处理。
10.1.1 处理命令行参数
你可以使用sys.argv
来获取命令行参数的列表。这对于从命令行接收输入文件名、输出文件名等参数非常有用。
import sys
if len(sys.argv) != 3:
print("Usage: python script.py input.txt output.txt")
sys.exit(1)
input_file = sys.argv[1]
output_file = sys.argv[2]
# 打开输入文件和输出文件进行处理
10.1.2 标准输入输出
sys.stdin
和sys.stdout
分别表示标准输入和标准输出。你可以使用它们来读取输入和写入输出。
import sys
data = sys.stdin.readline().strip() # 从标准输入读取一行
sys.stdout.write("Output data") # 写入标准输出
10.1.3 异常处理
sys.exc_info()
函数返回当前异常的信息,包括异常类型、异常值和异常追溯信息。这在调试和异常处理中非常有用。
import sys
try:
result = 1 / 0 # 引发异常
except Exception:
exc_type, exc_value, exc_traceback = sys.exc_info()
print(f"Exception Type: {exc_type}")
print(f"Exception Value: {exc_value}")
print("Exception Traceback:")
traceback.print_tb(exc_traceback)
10.2 math模块
math
模块提供了各种数学函数和常数,可用于数学计算。这对于在竞赛编程中执行数学操作非常有用。
10.2.1 常数
math
模块包含一些常见的数学常数,如π和自然对数的底e。
import math
pi = math.pi
e = math.e
10.2.2 数学函数
math
模块提供了各种数学函数,如平方根、对数、三角函数等。
import math
x = 16
sqrt_x = math.sqrt(x) # 计算平方根
log_x = math.log(x) # 计算自然对数
sin_x = math.sin(x) # 计算正弦值
10.2.3 数学运算
math
模块还包括数学运算,如阶乘、幂运算等。
import math
factorial_5 = math.factorial(5) # 计算5的阶乘
power_2_3 = math.pow(2, 3) # 计算2的3次幂
10.3 random模块
random
模块用于生成伪随机数,可以用于模拟、随机化算法等。在竞赛编程中,你可能需要生成随机数来测试算法的性能和正确性。
10.3.1 随机数生成
random
模块提供了生成随机数的函数,包括整数和浮点数的随机数。
import random
rand_int = random.randint(1, 10) # 生成1到10之间的随机整数
rand_float = random.uniform(0, 1) # 生成0到1之间的随机浮点数
10.3.2 随机序列操作
你可以使用random
模块来对序列进行随机化操作,如洗牌。
import random
my_list = [1, 2, 3, 4, 5]
random.shuffle(my_list) # 随机打乱列表元素的顺序
10.3.3 随机种子
你可以使用random.seed()
来设置随机数生成的种子,以确保生成的随机数可重现。
import random
random.seed(42) # 设置随机种子为42
rand_num = random.randint(1, 10) # 随机数是确定的
这些模块提供了在竞赛编程中常见的功能,帮助你更轻松地处理输入、进行数学计算以及生成随机数。根据问题的需求,你可以灵活使用这些模块来解决各种问题。
当进行竞赛编程时,还有一些其他常用的Python模块,它们可以帮助你解决各种问题,包括字符串处理、时间操作、数据结构等。以下是一些其他常用的模块:
10.4 字符串处理模块
10.4.1 re
模块
re
模块是正则表达式模块,用于处理字符串的模式匹配和替换。你可以使用正则表达式来搜索、提取和操作字符串,这在一些需要处理复杂文本的问题中非常有用。
import re
pattern = r'\d+' # 匹配一个或多个数字
text = "The price is $100 and the discount is $20."
matches = re.findall(pattern, text) # 查找匹配的数字
10.4.2 string
模块
string
模块提供了一些与字符串处理相关的常量和工具函数。它包括各种字符集合,如ASCII字母、数字、标点符号等。
import string
print(string.ascii_lowercase) # 所有小写字母
print(string.digits) # 所有数字
10.5 时间模块
10.5.1 datetime
模块
datetime
模块用于处理日期和时间。你可以使用它来执行日期和时间的操作,如日期格式化、日期算术等。
from datetime import datetime, timedelta
now = datetime.now() # 获取当前日期和时间
tomorrow = now + timedelta(days=1) # 计算明天的日期
10.5.2 time
模块
time
模块提供了与时间相关的函数,如等待一段时间、获取当前时间等。这在一些需要控制时间间隔的问题中非常有用。
import time
start_time = time.time() # 获取当前时间戳
time.sleep(2) # 等待2秒
end_time = time.time()
elapsed_time = end_time - start_time
10.6 数据结构模块
10.6.1 collections
模块
collections
模块提供了一些有用的数据结构,如defaultdict
、Counter
等。这些数据结构可以帮助你更轻松地处理数据,如计数、分组等。
from collections import defaultdict, Counter
# 创建一个默认字典,用于统计元素出现次数
counts = defaultdict(int)
for item in [1, 2, 1, 3, 2, 1]:
counts[item] += 1
# 使用Counter计算元素频率
data = [1, 2, 1, 3, 2, 1]
frequency = Counter(data)
10.6.2 heapq
模块
heapq
模块提供了堆(heap)数据结构的支持,可以用于实现优先队列和堆排序等操作。
import heapq
# 创建一个最小堆
heap = [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5]
heapq.heapify(heap)
# 弹出最小值
min_value = heapq.heappop(heap)
这些模块提供了在竞赛编程中处理字符串、时间和数据结构的有用工具。根据问题的性质,你可以灵活使用这些模块来提高代码的效率和可读性。
当进行竞赛编程时,还有一些其他有用的Python模块,可以帮助你解决各种问题。以下是一些其他常用的模块:
10.7 文件操作模块
10.7.1 os
模块
os
模块用于与操作系统交互,执行文件和目录操作。你可以使用它来检查文件是否存在、创建目录、删除文件等。
import os
if os.path.exists("file.txt"):
os.remove("file.txt") # 删除文件
10.7.2 shutil
模块
shutil
模块是os
模块的扩展,提供了更多文件和目录操作的函数。它可以用于复制、移动、重命名文件,以及递归地复制目录等操作。
import shutil
shutil.copy("source.txt", "destination.txt") # 复制文件
shutil.move("source.txt", "new_directory/source.txt") # 移动文件
10.8 网络操作模块
10.8.1 requests
模块
requests
模块用于发送HTTP请求和处理HTTP响应。你可以使用它来从网页获取数据、与API交互等。
import requests
response = requests.get("https://www.example.com")
data = response.text # 获取网页内容
10.8.2 socket
模块
socket
模块提供了低级网络通信功能,允许你创建网络套接字并进行数据传输。这对于网络编程和竞赛中的一些问题非常有用。
import socket
server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
server_socket.bind(("localhost", 8080))
server_socket.listen(1)
client_socket, client_address = server_socket.accept()
10.9 其他工具模块
10.9.1 itertools
模块
itertools
模块提供了一组用于迭代和操作迭代器的函数。它包括各种迭代器生成器、排列组合生成器等。
import itertools
# 生成排列
permutations = itertools.permutations([1, 2, 3])
10.9.2 json
模块
json
模块用于处理JSON数据,包括JSON的解析和生成。你可以使用它来与Web服务进行交互或在文件中保存和加载数据。
import json
data = {"name": "John", "age": 30}
json_str = json.dumps(data) # 将Python对象转换为JSON字符串
loaded_data = json.loads(json_str) # 将JSON字符串转换为Python对象
这些模块提供了在竞赛编程中处理文件、网络通信和其他任务的有用工具。根据问题的性质,你可以选择适当的模块来帮助解决问题。
11. 调试技巧
在竞赛编程中,调试是解决问题的关键步骤之一。以下是一些常用的调试技巧,以帮助你找到代码中的错误并改进你的解决方案。
11.1 print语句
print
语句是最常用的调试工具之一。它允许你在代码中插入打印语句,以输出变量的值、中间结果和调试信息。
x = 42
print("The value of x is:", x)
11.1.1 输出变量值
你可以使用print
语句来输出变量的当前值,以便检查它们是否符合预期。
x = 42
print("x:", x)
11.1.2 输出中间结果
在代码的不同部分插入print
语句,以输出中间结果,有助于理解代码的执行流程。
for i in range(1, 6):
result = i * 2
print(f"{i} * 2 = {result}")
11.1.3 跟踪代码执行
使用print
语句来跟踪代码的执行流程,查看哪一部分代码被执行,以便找到问题所在。
print("Before the loop")
for i in range(3):
print("Inside the loop")
print("After the loop")
11.2 断言语句
断言语句允许你在代码中插入检查点,以确保某些条件为真。如果条件不满足,断言将引发AssertionError
异常。
x = 10
assert x > 0, "x should be greater than 0"
11.2.1 检查前提条件
使用断言语句来检查前提条件,确保变量的值在进入关键代码块之前满足某些条件。
def divide(a, b):
assert b != 0, "Cannot divide by zero"
return a / b
11.2.2 调试问题代码
插入断言语句来检查问题代码中的中间状态,以帮助确定问题出在哪里。
def find_max(nums):
assert len(nums) > 0, "Input list should not be empty"
max_value = nums[0]
for num in nums:
assert num >= 0, "Negative numbers not allowed"
if num > max_value:
max_value = num
return max_value
11.3 调试器
Python提供了强大的调试工具,可以用于逐行调试代码,查看变量的值,设置断点等。其中最常用的调试器之一是pdb
(Python Debugger)。
11.3.1 启动调试器
要在代码中启动pdb
调试器,你可以在需要的地方插入以下行:
import pdb; pdb.set_trace()
然后运行你的代码,当执行到该行时,程序将进入交互式调试模式。
11.3.2 调试命令
在pdb
调试模式中,你可以使用各种命令来探查和操作代码。一些常见的命令包括:
-
n
:下一步(执行下一行代码)。 -
c
:继续执行代码直到下一个断点。 -
s
:进入函数调用。 -
q
:退出调试器。 -
p variable
:打印变量的值。 -
b line_number
:在指定行设置断点。
11.3.3 交互式调试
使用pdb
调试器可以在代码执行过程中交互地查看变量的值,帮助你理解代码的行为和找到问题。
import pdb
def divide(a, b):
pdb.set_trace() # 启动调试器
result = a / b
return result
以上是一些常见的调试技巧和工具,可以帮助你更轻松地找到和修复代码中的错误。不同的问题可能需要不同的调试方法,因此熟练掌握这些技巧将有助于提高你的竞赛编程效率。
12. functools.lru_cache
装饰器
functools.lru_cache
装饰器是Python标准库中的一个强大工具,用于缓存函数的结果。LRU代表"Least Recently Used",表示最近最少使用,这意味着缓存中的结果将基于最近的函数调用情况进行管理。这个装饰器在竞赛编程中非常有用,可以显著提高函数的性能。
12.1 使用functools.lru_cache
要使用functools.lru_cache
,首先需要导入functools
模块:
import functools
然后,你可以将@functools.lru_cache
装饰器应用到你想要缓存结果的函数上。
@functools.lru_cache(maxsize=None)
def your_function(arguments):
# 函数的计算逻辑
-
maxsize
参数定义了缓存的大小。默认情况下,它为None
,表示缓存的大小不受限制。你可以将其设置为一个整数,以限制缓存的大小。例如,maxsize=128
表示缓存最多存储128个不同参数的结果。
12.2 使用示例
下面是一个示例,演示了如何使用functools.lru_cache
来缓存斐波那契数列的计算,以提高性能。
import functools
@functools.lru_cache(maxsize=None)
def fibonacci(n):
if n < 2:
return n
else:
return fibonacci(n - 1) + fibonacci(n - 2)
result = fibonacci(100) # 计算斐波那契数列的第100个数
在这个示例中,斐波那契数列的计算本来会非常耗时,但由于使用了functools.lru_cache
,之前计算过的结果会被缓存,以避免重复计算。
12.3 使用场景
functools.lru_cache
装饰器在竞赛编程中有很多潜在的用途,包括:
- 避免重复计算:对于需要重复计算的问题,可以使用装饰器来缓存已经计算过的结果,以提高性能。
- 优化递归算法:递归算法通常会涉及到重复计算。使用装饰器可以显著提高递归算法的性能。
- 动态规划问题:在动态规划问题中,往往需要计算和存储中间结果。
functools.lru_cache
可以方便地实现这一目标。 - Memoization:Memoization是一种通过缓存中间结果来加速算法的技术,
functools.lru_cache
正是这一技术的实现。
12.4 注意事项
使用functools.lru_cache
时,需要注意以下几点:
- 缓存是有限的,如果缓存满了,最旧的结果将被丢弃,因此需要慎重选择
maxsize
参数。 - 被缓存的函数的参数必须是可哈希的,因为缓存使用参数的哈希值来识别不同的参数组合。
- 不要尝试在多线程或多进程的环境中共享缓存。
functools.lru_cache
是一个强大的工具,可以用来优化代码并加速函数的执行。在竞赛编程中,它经常用于处理需要频繁计算的问题,特别是递归和动态规划问题。
总结
通过本笔记,你将掌握以下关键内容:
- Python的基本语法,包括注释、变量和数据类型。
- 控制流,包括条件语句和循环语句。
- 函数的定义和使用。
- 异常处理,处理程序中的错误情况。
- 数据结构,如列表、元组、集合和字典。
- 排序算法,如冒泡排序、选择排序、插入排序和快速排序。
- 查找算法,如线性查找和二分查找。
- 图论算法,包括深度优先搜索、广度优先搜索、最短路径算法和最小生成树算法。
- 动态规划算法,解决背包问题、最长公共子序列和最长递增子序列等。
- 输入输出和常用模块的使用。
- 调试技巧,包括print语句、断言语句和调试器的应用。
- 实战演练,通过经典例题和真实比赛的训练,提高算法竞赛技能。