💭 写在前面
本篇博客将开始介绍 Pintos 的基本知识,为 Pintos 的 Project1 用户程序(User Program)做必要的只是铺垫,讲解 Pintos 运行原理、虚拟内存、页函数以及系统调用的实现。
📜 文章目录
0x00 背景介绍
0x01 用户程序是如何工作的(How User Program Works)
0x02 前置知识:Pintos 运行原理
0x03 代码实现
0x04 虚拟内存(Virtual Memory)
0x05 页函数(Functions for page)
0x06 系统调用(System Calls)
0x00 背景介绍
Pintos 是一个简单的操作系统,它可以启动,允许应用程序,关机。
你可以试着在 Pintos 上运行应用程序 "echo" :
① 首先在 src/examples 和 src/userprog
- cd 至 src/examples 目录下,输入 make:
- cd 至 src/userprog 下,输入 make:
② 在 /src/userprog 路径下输入运行它
- 输入如下指令,利用 echo 打印 x (注意 -a echo 后面是两个 -)
~/pintos/src/userprog $
pintos --filesys-size=2 -p ../examples/echo -a echo -- -f -q run 'echo x'
熟悉的 "Powering off..." 这个 echo 程序看上去已经运行成功了,但是似乎没有出现结果。
0x01 用户程序是如何工作的(How User Program Works)
仔细观察前面指令的细节:
~/pintos/src/userprog $
pintos --filesys-size=2 -p ../examples/echo -a echo -- -f -q run 'echo x'
- --filesys-size=2: 生成大小为 2mb 的模拟 Pintos 磁盘(disk)。
- -p ../examples/echo -a echo: 将 .../examples/echo 复制到模拟磁盘,并将名称从 .../examples/echo 改为 echo 。
- -- :在 echo 和 -f 之间:将 pintos 的选项和内核参数分离开。
- -f:Pintos 对模拟磁盘进行格式化操作。
- -q:在用户执行完 echo 后 Pintos 将终止。
- run 'echo x' :Pintos 将以 x 作为参数,执行 echo。
❓ 再次思考:我们为什么看不看到 echo
这是因为在目前的 Pintos 中,系统调用(system call)、系统调用处理程序(system call handler)、参数传递(argument passing)和 用户栈(user stack)都没有实现!
(这些都是要你动手操作的,加油)
可以说,目前的 Pintos 其实就是个空壳子,许多操作系统应具有的功能都没有,这些都是斯坦福专家们精心为你准备的练习,让你自己手糊一个操作系统玩玩。说得轻松,但是难度真的不容小觑!
0x02 前置知识:Pintos 运行原理
如果想明白的更透彻,我们这里可以了解一下 Pintos 的运行原理。
Pintos 可以加载和运行常规的 ELF(Executable & Linkable Format)可执行文件。
因此要运行一个用户程序,我们必须把用户程序复制到模拟磁盘上(可以参考刚才指令的细节)。
~/pintos/src/userprog $
pintos --filesys-size=2 -p ../examples/echo -a echo -- -f -q run 'echo x'
- echo 是一个把参数写入标准输出(Standard Output)的应用程序。
- 因此,echo 需要内核中的系统调用所提供的 功能
- 并且还需要用到用户栈,在栈上存储参数并将它们传递给内核。
- 但是,当前的 Pintos 没有实现 系统调用 和 用户栈 。
echo x 结果的原因!
0x03 代码实现
溪云初起日沉阁,山雨欲来风满楼。
在这个项目中,我们需要让 Pintos 能够正确执行 "用户程序" ,我们应该在下列目录下完成,并修改下列文件:
代码级流程(Code Level Flow)
$ pintos --filesys-size=2 -p ../examples/echo -a echo -- -f -q run 'echo x'
/* 運行 */
run_actions(argv);
/* 終了 */
shutdown();
thread_exit();
💬 run_actions 函数:
run_actions(char** argv )
{
/* An action */
struct action {
char* name;
int argc;
void(*function) (char ** argv);
};
/* Table of supported actions. */
static const struct action actions[] = {
{"run", 2, run_task},
#ifdef FILESYS
{"ls", 1, fsutil_ls},
while(*argv != NULL) {
const struct action* a;
int i;
/* Find action name. */
for (a = actions; ; a++)
if (a->name == NULL)
PANIC("unknow action");
else if (!strcmp(*argv, a->name))
break;
/* Check for required arguments. */
for (i = 0; i < a->argc; i++)
if (argv[i] == NULL)
PANIC("action");
/* Invoke action and advance. */
a->function(argv);
argv += a->argc;
}
💬 run_task 函数:
static void run_task (char** argv)
{
const char* task = argv[1];
printf("Excuting '%s': \n", task);
#ifdef USERPROG
process_wait (process_execute(task));
#else
run_test(test);
#endif
printf("Execution of '%s' complete.\n", task);
}
💬 process_execute 函数:
tid_t process_execute (
const char* file_name
)
{
char* fn_copy;
tid_t tid;
/* Make a copy of FILE_NAME.
Otherwise there's a race between the caller and load(). */
fn_copy = palloc_get_page(0);
if (fn_copy == NULL)
return TID_ERROR;
strlcpy(fn_copy, file_name, PGSIZE);
/* Create a new thread to execute FILE_NAME. */
tid = thread_create (file_name, PRI_DEFAULT, start_process, fn_copy);
if (tid == TID_ERROR)
palloc_free_page (fncopy);
return tid;
}
pintos 工具选项:
$ pintos --filesys-size=2 -p ../examples/echo -a echo -- -f -q run 'echo x'
👆 👆
多字符选项 单字符选项
- - :表示单字符选项
- - - :表示多个字符的选项 (你可以通过执行 pintos --help 来阅读选项)
分隔符:
$ pintos --filesys-size=2 -p ../examples/echo -a echo -- -f -q run 'echo x'
👆
[Pintos选项] 分隔符 [内核参数]
- - - :Pintos 选项和 Pintos 内核参数之间的分隔符
* 根据 80x86 调用约定设置用户栈。
0x04 虚拟内存(Virtual Memory)
Pintos 将内存分为两个区域,用户内存和内核内存。
如果我们直接使用这些内存区域,就很难管理内存,例如:
- 每个进程都可以相互销毁
- 进程可以破坏对运行操作系统至关重要的内核代码
为了防止这些问题,操作系统采用了 虚拟内存系统(virtual memory system)。
由于虚拟内存的存在,每个进程都可以拥有自己专属的内存区域,并且能够使用它,就像该进程享用了整个内存一样。
而 Pintos 也是采用虚拟内存来管理内存区域的。
🔺 虚拟内存会被划分为两个区域:用户虚拟内存、内核虚拟内存。
虚拟内存:启动应用程序
内核虚拟内存是全局的,
Pintos 中的虚拟内存
- 每个进程都有自己的用户虚拟内存。
- Pintos分配给内核1GB作为全局内存。(PHYS_BASE (3 GB) ~ 4 GB的虚拟内存)
- 内存单元在Pintos中是一个页,大小为4KB。
- 用户程序可以通过页目录和页表翻译虚拟地址来访问物理内存。(参考上图 "页表")。
0x05 页函数(Functions for page)
threads/palloc.c
is_user_vaddr() // 检查给定的虚拟地址是否是用户虚拟地址
is_kernel_vaddr() // 检查给定的虚拟地址是否是内核虚拟地址
ptov() // 将物理地址转换为内核虚拟地址
vtop() // 将内核虚拟地址转换为物理地址
threads/palloc.c
palloc_get_page() // 从用户或内核内存池中获取页
userprog/pagedir.c
pagedir_create() // 创建页表
pagedir_get_page() // 查询页面目录中与用户虚拟地址相对应的物理地址
pagedir_set_page() // 在页面目录中添加从用户虚拟地址到物理页面的映射
0x06 系统调用(System Calls)
正如我们所见,Pintos 将内存分为 用户虚拟内存 和 内核虚拟内存,以保护每个进程和内核代码。
随着虚拟内存的概念,操作系统防止用户程序访问包含核心功能的内核内存。
那么用户程序该如何使用内核的功能呢?
💡 操作系统提供了 系统调用(System Calls)来解决这个问题!
- 出于安全性考虑,操作系统提供了两种模式 —— 用户模式 和 内核模式。
- 当用户程序在用户模式下运行时,它不能访问内存或磁盘。
- 这些操作是在 内核模式 下进行的。
- 操作系统提供了进入内核模式的 系统调用 。
Pintos 在 lib/user/syscall.c
在 userprog/syscall.c
Pintos 中的系统调用程序
#include <stdio.h>
#include <syscall.h>
int main(int argc, char* argv[])
{
bool success = true;
int i;
for (i = 1; i < argc; i++)
{
int fd = open(argv[i]);
if (fd < 0)
{
printf("%s: open failed\n", argv[i]);
success = false;
continue;
}
- 系统调用号 和 附加 参数 被压到调用者的栈中。
- 通过使用 int $0x30
int open(const char* file)
{
return syscall1 (SYS_OPEN, file);
}
/* Invokes syscall NUMBER, passing argument ARGO, and returns the
return value as and 'int'. */
#define syscall1(NUMBER, ARG0) \
(
int retval; \
asm volatile
("pushl %[arg0]; pushl %[number]; int $0x30; addl $8, %%esp" \
// 从系统调用处理程序返回后,恢复栈指针。
: "=aa" (retval)
: [number] "i" (NUMBER), \
[arg0] "g" (ARG0) \
: "memory"); \
retval; \
} )
.func intr_entry
intr_entry:
/* 保存调用者的寄存器 */
pushl %ds
pushl %es
pushl %fs
pushl %gs
pushal
/* 设置内核环境 */
cld // 字符串指令向上走
mov $SEL_KDSEG, %eax // 初始化段寄存器
mov %eax, %ds
mov %eax, %es
leal 56(%esp), %edp // 设置框架指针
/* 调用中断处理程序 */
push %esp
.glovl intr_handler
call intr_handler // Call interrupt handler
andl $4, %esp
.endfunc
threads/intr-stubs.S
void intr_handler(struct intr_frame* frame)
{
bool external;
intr_handler_func* handler;
/* 外部中断很特别
我们一次只能处理一个(所以中断必须关闭)
而且它们需要在PIC上被确认(见下文)
一个外部中断处理程序无法休眠。 */
external = frame->vec_no >= 0x20 && frame->vec_no < 0x30;
if (external)
{
ASSERT (intr_get_level() == INTR_OFF);
ASSERT (!intr_context());
in_external_intr = true;
yield_on_retrun = false;
}
/* 启用中断处理程序 */
handler = intr_handlers[frame->vec_no];
if (handler != NULL)
handler(frame);
在 Pintos 启动时,系统调用的中断处理程序就已经被注册了。
* 参考以下函数调用:
- main() in 'threads/init.c' calls syscall_init() which is in 'userprog/syscall.c'
- syscall_init() calls intr_register_int() in 'threads/interrupt.c'
- syscall_handler() 得到控制权,它可以通过 intr_frame 结构的 'esp' 成员访问栈(在threads/interrupt.h。
- 80x86 的惯例是将系统调用的返回值存储在 EAX 寄存器中,因此我们可以将返回值存储在intr_frame 结构的 'eax' 成员中。
static void syscall_handler(struct intr_frame* f UNUSED)
{
printf("system call!\n");
thread_exit();
}
* Pintos 提供了系统调用处理程序的骨架,我们将在这个项目中开发它。
struct intr_frame
{
/* 由intr-stubs.S中的 intr_entry 推送,
这些是保存被中断任务的寄存器。 */
uint32_t ebx; // 保存EBX
unit32_t edx; // 保存EDX
unit32_t ecx; // 保存ECX
unit32_t eax; // 保存EAX
void* esp; // 保存栈指针
uint16_t ss, :16; // esp的数据段
};
需要修改的: syscall.c process.c
📌 [ 笔者 ] 王亦优
📃 [ 更新 ] 2022.9.24
❌ [ 勘误 ] /* 暂无 */
📜 [ 声明 ] 由于作者水平有限,本文有错误和不准确之处在所难免,
本人也很想知道这些错误,恳望读者批评指正!
📜 参考资料 Remzi H. Arpaci-Dusseau and Andrea C. Arpaci-Dusseau, Operating Systems: Three Easy Pieces A. Silberschatz, P. Galvin, and G. Gagne, Operating System Concepts, 9th Edition, John Wiley & Sons, Inc., 2014, ISBN 978-1-118-09375-7. Microsoft. MSDN(Microsoft Developer Network)[EB/OL]. []. . 百度百科[EB/OL]. []. https://baike.baidu.com/. |