此处的python 网络编程主要指的是TCP 编程
Socket 是网络编程的一个抽象概念。
通常我们用一个Socket 表示“打开了一个网络链接”,而打开一个Socket 需要知道目标计算机的IP 地址和端口号,再指定协议类型即可。(和Java 一样)
一、客户端
Ⅰ 建立连接
创建一个基于TCP 连接的Socket:
#导入socket 库
import socket
# 创建一个socket
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 建立连接
s.connect(('www.sina.com.cn', 80))
创建Socket 时,AF_INET 指定使用IPv4 协议,如果要用更先进的IPv6,就指定为AF_INET6。
SOCK_STREAM 指定使用面向流的TCP 协议,这样,一个Socket 对象就创建成功,但是还没有建立连接。
客户端要主动发起TCP 连接,必须知道服务器的IP 地址和端口号。
新浪网站的IP 地址可以用域名www.sina.com.cn
自动转换到IP
地址,且80
是互联网网页服务的熟知端口。
注:若我们要连接自己的服务端,则此处应改成我们服务端的IP 地址和端口
Ⅱ 数据发收
建立TCP 连接后,我们就可以向新浪服务器发送请求,要求返回首页的内容:
# 发送数据:
s.send(b'GET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n')
然后就可以开始接收服务器返回的数据了:
# 接收数据:
buffer = []
while True:
# 每次最多接收1k字节:
d = s.recv(1024)
if d:
buffer.append(d)
else:
break
data = b''.join(buffer)
接收数据时,调用recv(max)
方法,一次最多接收指定的字节数,因此,在一个while 循环中反复接收,直到recv()
返回空数据,表示接收完毕,退出循环。
当我们接收完数据后,调用close()
方法关闭Socket,这样,一次完整的网络通信就结束了:
# 关闭连接:
s.close()
Ⅲ 数据处理
接收到的数据包括HTTP 头和网页本身,我们只需要把HTTP 头和网页分离一下,把HTTP 头打印出来,网页内容保存到文件:
html = b''.join(data.split(b'\r\n\r\n', 1))
# 把接收的数据写入文件:
with open('sina.html', 'wb') as f:
f.write(html)
将上述片段组合:
# 导入socket库:
import socket
# 创建一个socket 并建立连接:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.connect(('www.baidu.com', 80))
# 发送数据:
s.send(b'GET /HTTP/1.1\r\nHost: www.baidu.com\r\nConnection: close\r\n\r\n')
# 接收数据
buffer = []
while True:
# 每次最多接收1k字节:
d = s.recv(1024)
if d:
buffer.append(d)
else:
break
data = b''.join(buffer)
# 关闭连接:
s.close()
html = b''.join(data.split(b'\r\n\r\n', 1))
# 把接收的数据写入文件:
with open('bd.html', 'wb') as f:
f.write(html)
二、服务端
服务器进程首先要绑定一个端口并监听来自其他客户端的连接。如果某个客户端连接过来了,服务器就与该客户端建立Socket 连接,随后的通信就靠这个Socket 连接了。
所以,服务器会打开固定端口(比如80
)监听,每来一个客户端连接,就创建该Socket 连接。由于服务器会有大量来自客户端的连接,所以,服务器要能够区分一个Socket 连接是和哪个客户端绑定的。一个Socket 依赖4项:服务器地址、服务器端口、客户端地址、客户端端口来唯一确定一个Socket。
但是服务器还需要同时响应多个客户端的请求,所以,每个连接都需要一个新的进程或者新的线程来处理,否则,服务器一次就只能服务一个客户端
Ⅰ 建立连接
创建一个基于IPv4 和TCP 协议的Socket:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
我们要绑定监听的地址和端口。
服务器可能有多块网卡,可以绑定到某一块网卡的IP 地址上,也可以用0.0.0.0
绑定到所有的网络地址,还可以用127.0.0.1
绑定到本机地址
127.0.0.1
是一个特殊的IP地址,表示本机地址,如果绑定到这个地址,客户端必须同时在本机运行才能连接,也就是说,外部的计算机无法连接进来
端口号需要预先指定。
因为我们写的这个服务不是标准服务,所以用9999
这个端口号
小于
1024
的端口号必须要有管理员权限才能绑定
# 监听端口:
s.bind(('127.0.0.1', 9999))
紧接着,调用listen()
方法开始监听端口,传入的参数指定等待连接的最大数量:
s.listen(5)
print('Waiting for connection...')
Ⅱ 新建Socket
接下来,服务器程序通过一个永久循环来接受来自客户端的连接,accept()
会等待并返回一个客户端的连接:
while True:
# 接受一个新连接:
sock, addr = s.accept()
# 创建新线程来处理TCP连接:
t = threading.Thread(target=tcplink, args=(sock, addr))
t.start()
注:每个连接都必须创建新线程(或进程)来处理,否则,单线程在处理连接的过程中,无法接受其他客户端的连接:
def tcplink(sock, addr):
print('Accept new connection from %s:%s...' % addr)
sock.send(b'Welcome!')
while True:
data = sock.recv(1024)
time.sleep(1)
if not data or data.decode('utf-8') == 'exit':
break
sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8'))
sock.close()
print('Connection from %s:%s closed.' % addr)
连接建立后,服务器首先发一条欢迎消息,然后等待客户端数据,并加上Hello
再发送给客户端。如果客户端发送了exit
字符串,就直接关闭连接。
完整的客户端程序:
import socket
# 建立连接
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.connect(('127.0.0.1', 9999))
print(s.recv(1024).decode('utf-8'))
# 发送数据
for data in [b'haha', b'you are loser', b'byebye']:
s.send(data)
print(s.recv(1024).decode('utf-8'))
s.send(b'exit')
# 关闭连接
s.close()
完整的服务端程序:
import socket
import threading
import time
# 建立Socket
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.bind(('127.0.0.1', 9999))
# 开始监听端口
s.listen(5)
print('Waiting for connection...')
def tcplink(sock, addr):
print('Accept new connection from %s:%s...' % addr)
# 发送数据
sock.send(b'Welcome!')
# 接收数据
while True:
data = sock.recv(1024)
time.sleep(1)
if not data or data.decode('utf-8') == 'exit':
break
sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8'))
# 关闭Socket
sock.close()
print('Connection from %s:%s closed.' % addr)
# 等待连接
while True:
sock, addr = s.accept()
# 建立新进程
t = threading.Thread(target=tcplink, args=(sock, addr))
t.start()
最后结果: