大家知道,当Android系统启动时候,会解析init.rc文件,然后根据里面的定义,启动各种服务,如netd、zygote、servier_manager等等,但这些服务之间其实是有依赖关系的,而且当其中的某个服务启动失败时,有时候会影响后续的服务启动。这篇文章就具体的分析一下开机服务的启动顺序。

服务的分类

init.rc中对服务做了分类,在service section里面有一个’class’标签,指明了该服务所属的类。如:

service surfaceflinger /system/bin/surfaceflinger
    class core  //所属类为‘core’
    user system
    group graphics drmrpc
    onrestart restart zygote

service media /system/bin/mediaserver
    class main  //所属类为‘main’
    user media
    group audio camera inet net_bt net_bt_admin net_bw_acct drmrpc mediadrm system
    ioprio rt 4

init.rc中总共有三个分类:core、main和late_start,下面整理了各分类下属的服务:

  • core

ueventd、logd、healthd、adbd(disabled)、lmkd(LowMemoryKiller)、servicemanager、vold、debuggerd、surfaceflinger、bootanim(disabled)等

core分类中的服务都是一些核心服务,它们不启动,后续的服务或系统启动就可能出问题。比如servicemanager,binder通信大管家,它的启动很靠前,因为,其他服务启动时候需要向servicemanager注册binder服务。vold,负责存储类设备的挂载;还有surfaceflinger,图形显示的核心服务等。

  • main

debuggerd64、drm、media、ril-daemon、installd、flash_recovery、racoon(disabled)、mtpd(disabled)、keystore、dumpstate(disabled)、mdnsd(disabled)、pre-recovery(disabled)、cmd_services(disabled)、phasecheckserver、zygote等。

main分类中的服务是一些系统的基本服务,有了这些服务android系统、Java世界才能正常运行。

  • late_start:字面意思是晚些启动。/device/中一些硬件厂商的.rc文件中会将一些服务设置为该类。

上面服务后面加”(disabled)”,代表init进程在初始化阶段不会启动该服务。该服务的启动是由其他的因素触发而启动的,比如:

on property:persist.sys.cmdservice.enable=enable
    start cmd_services

表示当属性persist.sys.cmdservice.enable的值设置为enable时,会触发该action,执行下面的命令。由于命令是start,所以init进程会启动cmd_services。

除了“disabled”的服务,上面的顺序基本上就是服务的开机启动顺序,即先启动core服务,然后启动main服务,最后启动late_start类别的服务。注意,相同类别的服务,基本上是同时启动,相互之间的延时很小。

服务的启动

首先看一下,init.c–>main()源码:

int main(int argc, char **argv)
{
    ...
    action_for_each_trigger("early-init", action_add_queue_tail);
    ...
    action_for_each_trigger("init", action_add_queue_tail);
    ...
    action_for_each_trigger("late-init", action_add_queue_tail);
    ...
    for(;;) {
        ...
        execute_one_command();
        ...
    }
}

可以看到,依次将early-init、init、late-init三个section对应的命令插入到操作队列中。
然后在后面的for循环中,调用execute_one_command依次执行操作队列中的命令。
那early-init、init、late-init都定义了哪些操作呢?我们看一下init.rc中的定义。这里,我们只关注服务的启动,其他的操作屏蔽掉。

on early-init
    ...
    start ueventd  //ueventd是init启动的第一个进程
    ...

on init
    ... // 创建各种路径,并写入一些参数

on late-init
    //trigger 会调用action_for_each_trigger("xxx", action_add_queue_tail);
    //从而将xxx section里的操作加入操作队列

    // mount文件系统相关的操作
    trigger early-fs 
    trigger fs 
    trigger post-fs
    trigger post-fs-data

    trigger load_all_props_action  //加载属性
    trigger firmware_mounts_complete

    trigger early-boot //将‘early-boot’中的操作加入执行队列
    trigger boot  //将‘boot’中的操作加入执行队列

on early-boot
    ... // kernel trace相关

on boot
    ...
    class_start core // 启动core类别的服务

前面说了core类别的服务有很多,那这些服务的启动顺序怎么定义的呢?init进程在解析init.rc(init.rc中还import了其他的rc文件,解析完init.rc后,依次解析其他的rc文件)文件时,是从上到下依次解析,并存放在一个全局链表中的。服务的启动顺序就是该服务在全局链表中的位置。所以在rc文件中定义靠前的服务也会在全局链表的靠前位置,也就会先执行。
core类别的服务启动完了,那main类别的服务什么时候启动呢?
init.rc中对启动main类别服务的定义如下:

on nonencrypted
      class_start main
      class_start late_start

on property:vold.decrypt=trigger_restart_min_framework
      class_start main

on property:vold.decrypt=trigger_restart_framework
     class_start main
     class_start late_start

可见,有以上三种方式,会触发启动main类别的服务。通过名字可以看出,都和系统是否加密有关。
这里,我们分析一下nonencrypted。前面提到,在“late-init”section中会触发“fs”section。

on late-init
    ...
    trigger fs 
    ...

//这个section一般在init.${ro.hardware}.rc中定义
on fs 
    ...
    mount_all fstab
    ...

在“fs”section中会执行mount_all fstab命令。fstab是Android下比较重要的配置文件,它包含了系统在启动时挂载文件系统和存储设备的详细信息。对应的处理函数为:

int do_mount_all(int nargs, char **args)
{
    ...

    pid = fork();
    if (pid > 0) {
        // 父进程,等待子进程的处理返回结果
        int wp_ret = TEMP_FAILURE_RETRY(waitpid(pid, &status, 0));

        if (WIFEXITED(status)) {
            ret = WEXITSTATUS(status);
        } else {
            ret = -1;
        }
    } else if (pid == 0) {
        // 子进程,进一步调用fs_mgr_mount_all()
        fstab = fs_mgr_read_fstab(args[1]);
        child_ret = fs_mgr_mount_all(fstab);
        ...
        _exit(child_ret);
    } else {
        ...
    }

    if (ret == FS_MGR_MNTALL_DEV_NEEDS_ENCRYPTION) {
        ...
    } else if (ret == FS_MGR_MNTALL_DEV_MIGHT_BE_ENCRYPTED) {
        ...
    } else if (ret == FS_MGR_MNTALL_DEV_NOT_ENCRYPTED) {
        ...
        // 这里就将"nonencrypted"中的操作加入到操作队列中
        action_for_each_trigger("nonencrypted", action_add_queue_tail);
    } else if (ret == FS_MGR_MNTALL_DEV_NEEDS_RECOVERY) {
        ...
    }
    ...
}

这里注意:如果调用fs_mgr_mount_all()返回结果不是FS_MGR_MNTALL_DEV_NOT_ENCRYPTED,就不会执行action_for_each_trigger(“nonencrypted”, action_add_queue_tail);这样main类别的服务就不会执行,系统就会无法正常启动。

总结

本文简单介绍了系统启动阶段各服务的启动顺序,实际过程会复杂很多。有时间的话,会进一步补充。