多线程的优势
- 线程创建更加快速
- 线程间切换更加快速
- 线程容易终止
- 线程间通讯更快速
C语言的多线程可以通过gcc编译器中的pthread
实现。
案例1: hello world
#include <stdio.h>
#include <pthread.h>
void *myfunc(void *args){
printf("hello world!\n");
return NULL;
}
int main(int argc, char const *argv[])
{
pthread_t pt; //定义线程ID
pthread_create(&pt, NULL, myfunc, NULL); //创建线程
pthread_join(pt, NULL); //等待线程结束
return 0;
}
在上面的案例中,我们的main函数就是一个主线程,我们通过pthread_create
创建新的线程。主线程可以将任务放在一个队列中,用线程ID控制每个工作线程处理哪些任务。
因此我们需要学习核心函数pthread_create
的用法,
int pthread_create(pthread_t *thread, const pthread_attr_t *attr,
void *(*start_routine) (void *), void *arg);
它需要四个参数作为输入:
- 线程ID的地址,可以通过
pthread_t
进行定义, - 线程的属性,先不展开,直接用NULL
- 调用的函数
- 传入的参数,可以为NULL
对于第三个参数,pthread_create
要求该函数格式为void *函数名(void *args){}
形式,函数的参数对应第四个参数。
我们将上面的代码保存为example1.c
,然后进行编译运行
gcc -o example1 example1.c -lpthread
./example1
案例2: 多线程的hell world
上面代码中如果想要多个hello word, 最简单粗暴的方法就是通过手动复制的方法强行开多个线程,但是这样子就把线程给固定了,最好的方式是能够手动调整
#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
void *myfunc(void *args){
printf("hello world!\n");
return NULL;
}
int main(int argc, char const *argv[])
{
int n_threads = atoi(argv[1]);
pthread_t pt[n_threads];
for (int i = 0; i < n_threads; i++){
pthread_create(&pt[i], NULL, myfunc, NULL);
}
for (int i = 0; i < n_threads; i++){
pthread_join(pt[i], NULL);
}
return 0;
}
我们创建了一个存放不同线程ID的数组,通过一个for循环,创建多个线程运行,之后通过for循环等待线程结束。
将上面的代码保存为example2.c
,然后编译运行。
gcc -o example2 example2.c -lpthread
./example2
案例3: 数组分区间计算
案例1和案例2,我们都没有传入额外的参数,输出结果也只是直接输出到屏幕。这个案例,我们会创建一个大小为5000的数组,通过多线程分区块计算,然后合并。
#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
#define ARRSIZE 5000
//定义存放参数的结构体
typedef struct{
int start;
int end;
int sum;
int *arr;
pthread_t id;
} ptInfo;
//运行函数
void *myfunc(void *args){
ptInfo* info = (ptInfo *)args; //将void类型强制转换
int sum = 0;
for (int i = info->start; i < info->end; i++){
sum += info->arr[i];
}
info->sum = sum; //返回sum
return NULL;
}
int main(int argc, char const *argv[])
{
int n_threads = atoi(argv[1]);
ptInfo pt[n_threads];
int blocks = ARRSIZE / n_threads;
//初始化数组
int arr[ARRSIZE];
for (int i = 0; i < ARRSIZE; i++){
arr[i] = i;
}
//创建线程
for (int i = 0, j=0; i < ARRSIZE; j++){
pt[j].start = i;
pt[j].end = i + blocks;
pt[j].sum = 0;
pt[j].arr = arr;
fprintf(stderr, "running:%d-%d\n", pt[j].start, pt[j].end); //提示信息
pthread_create(&pt[j].id, NULL, myfunc, &pt[j]);
i += blocks;
}
int sum = 0;
for (int i = 0; i < n_threads; i++ ){
pthread_join(pt[i].id, NULL);
sum += pt[i].sum;
}
printf("sum: %d\n", sum);
return 0;
}
由于pthread_create
只接受一个传入参数,但是我们要提供的参数不只两个,因此我们定义了一个结构体,结构体中存放数组内存地址,起始位置和终止位置,求和结果,线程ID信息。
运行函数中,需要先将void *
类型转换成我们定义的结构体指针类型,最后计算结果更新到结构体中sum中。
接着我们写了一个循环,为每个线程分配处理范围,并创建线程。最后等待每个线程结束后,将计算结果保存到我们的sum中。
最后,我们将其保存为example3.c
, 然后编译运行
gcc -o example3 example3.c -lpthread
./example3 10
running:0-500
running:500-1000
running:1000-1500
running:1500-2000
running:2000-2500
running:2500-3000
running:3000-3500
running:3500-4000
running:4000-4500
running:4500-5000
sum: 1249750
注意这个代码存在bug,提供的线程数必须能被5000整除,不然就数组最后部分可能不会被算到。
以上几个案例只是简单介绍了C语言多线程的基本用法,处理数据也是相互独立,因此就不存在竞态条件(race condition), 也不需要引入互斥锁(mutex) ,也不涉及到假共享(false sharing)等高级知识点。对于这些知识点,可以参阅相关资料学习。