对于操作系统来说,进程管理是其最重要的职责之一。
考虑到这部分的内容较多,因此会拆分成几篇文章来讲解。
本文是进程管理系统文章的第一篇,会讲解Android系统中的进程创建。
本文适合Android平台的应用程序开发者,也适合对于Android系统内部实现感兴趣的读者。
概述
Android系统以Linux内核为基础,所以对于进程的管理自然离不开Linux本身提供的机制。例如:
1.通过fork来创建进行
2.通过信号量来管理进程
3.通过proc文件系统来查询和调整进程状态等
对于Android来说,进程管理的主要内容包括以下几个部分内容:
1.进程的创建
2.进程的优先级管理
3.进程的内存管理
4.进程的回收和死亡处理
本文会专门讲解进程的创建,其余部分将在后面的文章中讲解。
主要模块
为了便于下文的讲解,这里先介绍一下Android系统中牵涉到进程创建的几个主要模块。
同时为了便于读者更详细的了解这些模块,这里也同时提供了这些模块的代码路径。
这里提到的代码路径是指AOSP的源码数中的路径。
关于如何获取AOSP源码请参见这里:Downloading the Source。
本文以Android N版本的代码为示例,所用到的Source Code Tags是:android-7.0.0_r1。
相关模块:
app_process
代码路径:frameworks/base/cmds/app_process
说明:app_process是一个可执行程序,该程序的主要作用是启动zygote和system_server进程。
Zygote
代码路径:frameworks/base/core/java/com/android/internal/os/ZygoteInit.java
说明:zygote进程是所有应用进程的父进程,这是系统中一个非常重要的进程,下文我们会详细讲解。
ActivityManager
代码路径:frameworks/base/services/core/java/com/android/server/am/
说明:am是ActivityManager的缩写。
这个目录下的代码负责了Android全部四大组件(Activity,Service,ContentProvider,BroadcastReceiver)的管理,并且还掌控了所有应用程序进程的创建和进程的优先级管理。
因此,这个部分的内容将是本系列文章讲解的重点。
进程与线程
Android官方开发网站的这篇文章:Processes and Threads 非常好的介绍了Android系统中进程相关的一些基本概念和重要知识。
在阅读下文之前,请务必将这篇文章浏览一遍。
关于进程
在Android系统中,进程可以大致分为系统进程和应用进程两大类。
系统进程是系统内置的(例如:init,zygote,system_server进程),属于操作系统必不可少的一部分。系统进程的作用在于:
1.管理硬件设备
2.提供访问设备的基本能力
3.管理应用进程
应用进程是指应用程序运行的进程。这些应用程序可能是系统出厂自带的(例如Launcher,电话,短信等应用),也可能是用户自己安装的(例如:微信,支付宝等)。
系统进程的数量通常是固定的(出厂或者系统升级之后就确定了),并且系统进程通常是一直存活,常驻内存的。系统进程的异常退出将可能导致设备无法正常使用。
而应用程序和应用进程在每个人使用的设备上通常是各不一样的。如何管理好这些不确定的应用进程,就是操作系统本身要仔细考虑的内容。也是衡量一个操作系统好坏的标准之一。
在本文中,我们会介绍init,zygote和system_server三个系统进程。
除此之外,本系列文章将会把主要精力集中在讲解Android系统如何管理应用进程上。
init进程
init进程是一切的开始,在Android系统中,所有进程的进程号都是不确定的,唯独init进程的进程号一定是1。
因为这个进程一定是系统起来的第一个进程。并且,init进程掌控了整个系统的启动逻辑。
我们知道,Android可能运行在各种不同的平台,不同的设备上。因此,启动的逻辑是不尽相同的。
为了适应各种平台和设备的需求,init进程的初始化工作通过init.rc配置文件来管理。
你可以在AOSP源码的system/core/rootdir/路径找到这些配置文件。
配置文件的主入口文件是init.rc,这个文件会通过import引入其他几个文件。
在本文中,我们统称这些文件为init.rc。
init.rc通过Android Init Language来进行配置。
建议读者大致阅读一下其 语法说明 。
init.rc中配置了系统启动的时候该做哪些事情,以及启动哪些系统进程。
这其中有两个特别重要的进程就是:zygote和system_server进程。
zygote的中文意思是“受精卵“。这是一个很有寓意的名称:所有的应用进程都是由zygote fork出来的子进程,因此zygote进程是所有应用进程的父进程。
system_server 这个进程正如其名称一样,这是一个系统服务器。Framework层的几乎所有服务都位于这个进程中。这其中就包括管理四大组件的ActivityManagerService。
Zygote进程
init.rc文件会根据平台不一样,选择下面几个文件中的一个来启动zygote进程:
1.init.zygote32.rc
2.init.zygote32_64.rc
3.init.zygote64.rc
4.init.zygote64_32.rc
这几个文件的内容是大致一致的,仅仅是为了不同平台服务的。这里我们以init.zygote32.rc的文件为例,来看看其中的内容:
service zygote /system/bin/app_process -Xzygote /system/bin --zygote --start-system-server class main socket zygote stream 660 root system onrestart write /sys/android_power/request_state wake onrestart write /sys/power/state on onrestart restart audioserver onrestart restart cameraserver onrestart restart media onrestart restart netd writepid /dev/cpuset/foreground/tasks /dev/stune/foreground/tasks |
在这段配置文件中(如果你不明白这段配置的含义,请阅读一下文档:Android Init Language),启动了一个名称叫做zygote的服务进程。这个进程是通过/system/bin/app_process
这个可执行程序创建的。
并且在启动这个可执行程序的时候,传递了`-Xzygote /system/bin --zygote --start-system-server
class main` 这些参数。
要知道这里到底做了什么,我们需要看一下app_process的源码。
app_process的源码在这个路径:frameworks/base/cmds/app_process/app_main.cpp。
这个文件的main函数的有如下代码:
int main(int argc, char* const argv[]) { ... while (i < argc) { const char* arg = argv[i++]; if (strcmp(arg, "--zygote") == 0) { zygote = true; niceName = ZYGOTE_NICE_NAME; } else if (strcmp(arg, "--start-system-server") == 0) { startSystemServer = true; ... } ... if (!className.isEmpty()) { ... } else { ... if (startSystemServer) { args.add(String8("start-system-server")); } } ... if (zygote) { runtime.start("com.android.internal.os.ZygoteInit", args, zygote); } else if (className) { runtime.start("com.android.internal.os.RuntimeInit", args, zygote); } else { fprintf(stderr, "Error: no class name or --zygote supplied.\n"); app_usage(); LOG_ALWAYS_FATAL("app_process: no class name or --zygote supplied."); return 10; } } |
这里会判断
1.如果执行这个命令时带了--zygote参数,就会通过runtime.start启动com.android.internal.os.ZygoteInit。
2.如果参数中带有--start-system-server参数,就会将start-system-server添加到args中。
这段代码是C++实现的。在执行这段代码的时候还没有任何Java的环境。而runtime.start就是启动Java虚拟机,并在虚拟机中启动指定的类。于是接下来的逻辑就在ZygoteInit.java中了。
这个文件的main函数主要代码如下:
int main(int argc, char* const argv[]) { ... while (i < argc) { const char* arg = argv[i++]; if (strcmp(arg, "--zygote") == 0) { zygote = true; niceName = ZYGOTE_NICE_NAME; } else if (strcmp(arg, "--start-system-server") == 0) { startSystemServer = true; ... } ... if (!className.isEmpty()) { ... } else { ... if (startSystemServer) { args.add(String8("start-system-server")); } } ... if (zygote) { runtime.start("com.android.internal.os.ZygoteInit", args, zygote); } else if (className) { runtime.start("com.android.internal.os.RuntimeInit", args, zygote); } else { fprintf(stderr, "Error: no class name or --zygote supplied.\n"); app_usage(); LOG_ALWAYS_FATAL("app_process: no class name or --zygote supplied."); return 10; } } |
在这段代码中,我们主要关注如下几行:
1.通过 registerZygoteSocket(socketName);
注册Zygote Socket
2.通过 preload(); 预先加载所有应用都需要的公共资源
3.通过 startSystemServer(abiList, socketName);
启动system_server
4.通过 runSelectLoop(abiList); 在Looper上等待连接
这里需要说明的是:zygote进程启动之后,会启动一个socket套接字,并通过Looper一直在这个套接字上等待连接。
所有应用进程都是通过发送数据到这个套接字上,然后由zygote进程创建的。
这里还有一点说明的是:
在Zygote进程中,会通过preload函数加载需要应用程序都需要的公共资源。
预先加载这些公共资源有如下两个好处:
1.加快应用的启动速度 因为这些资源已经在zygote进程启动的时候加载好了
2.通过共享的方式节省内存 这是Linux本身提供的机制:父进程已经加载的内容可以在子进程中进行共享,而不用多份数据拷贝(除非子进程对这些数据进行了修改。)
preload的资源主要是Framework相关的一些基础类和Resource资源,而这些资源正是所有应用都需要的:
开发者通过Android SDK开发应用所调用的API实现都在Framework中。
static void preload() { Log.d(TAG, "begin preload"); Trace.traceBegin(Trace.TRACE_TAG_DALVIK, "BeginIcuCachePinning"); beginIcuCachePinning(); Trace.traceEnd(Trace.TRACE_TAG_DALVIK); Trace.traceBegin(Trace.TRACE_TAG_DALVIK, "PreloadClasses"); preloadClasses(); Trace.traceEnd(Trace.TRACE_TAG_DALVIK); Trace.traceBegin(Trace.TRACE_TAG_DALVIK, "PreloadResources"); preloadResources(); Trace.traceEnd(Trace.TRACE_TAG_DALVIK); Trace.traceBegin(Trace.TRACE_TAG_DALVIK, "PreloadOpenGL"); preloadOpenGL(); Trace.traceEnd(Trace.TRACE_TAG_DALVIK); preloadSharedLibraries(); preloadTextResources(); WebViewFactory.prepareWebViewInZygote(); endIcuCachePinning(); warmUpJcaProviders(); Log.d(TAG, "end preload"); } |
system_server进程
上文已经提到,zygote进程起来之后会根据需要启动system_server进程。
system_server进程中包含了大量的系统服务。例如:
1.负责网络管理的NetworkManagementService
2.负责窗口管理的WindowManagerService
3.负责震动管理的VibratorService
4.负责输入管理的InputManagerService
等等。关于system_server,我们今后会其他的文章中专门讲解,这里不做过多说明。
在本文中,我们只关注system_server中的ActivityManagerService这个系统服务。
ActivityManagerService
上文中提到:zygote进程在启动之后会启动一个socket,然后一直在这个socket等待连接。
而会连接它的就是ActivityManagerService。因为ActivityManagerService掌控了所有应用进程的创建。
所有应用程序的进程都是由ActivityManagerService通过socket发送请求给Zygote进程,然后由zygote
fork创建的。
ActivityManagerService通过Process.start方法来请求zygote创建进程:
public static final ProcessStartResult start(final String processClass, final String niceName, int uid, int gid, int[] gids, int debugFlags, int mountExternal, int targetSdkVersion, String seInfo, String abi, String instructionSet, String appDataDir, String[] zygoteArgs) { try { return startViaZygote(processClass, niceName, uid, gid, gids, debugFlags, mountExternal, targetSdkVersion, seInfo, abi, instructionSet, appDataDir, zygoteArgs); } catch (ZygoteStartFailedEx ex) { Log.e(LOG_TAG, "Starting VM process through Zygote failed"); throw new RuntimeException( "Starting VM process through Zygote failed", ex); } } |
这个函数会将启动进程所需要的参数组装好,并通过socket发送给zygote进程。然后zygote进程根据发送过来的参数将进程fork出来。
在ActivityManagerService中,调用Process.start的地方是下面这个方法:
private final void startProcessLocked(ProcessRecord app, String hostingType, String hostingNameStr, String abiOverride, String entryPoint, String[] entryPointArgs) { ... Process.ProcessStartResult startResult = Process.start(entryPoint, app.processName, uid, uid, gids, debugFlags, mountExternal, app.info.targetSdkVersion, app.info.seinfo, requiredAbi, instructionSet, app.info.dataDir, entryPointArgs); ... } |
下文中我们会看到,所有四大组件进程的创建,都是调用这里的startProcessLocked这个方法而创建的。
对于每一个应用进程,在ActivityManagerService中,都有一个ProcessRecord与之对应。这个对象记录了应用进程的所有详细状态。
PS:对于ProcessRecord的内部结构,在下一篇文章中,我们会讲解。
为了查找方便,对于每个ProcessRecord会存在下面两个集合中。
按名称和uid组织的集合:
/** * All of the applications we currently have running organized by name. * The keys are strings of the application package name (as * returned by the package manager), and the keys are ApplicationRecord * objects. */ final ProcessMap<ProcessRecord> mProcessNames = new ProcessMap<ProcessRecord>(); |
按pid组织的集合:
/** * All of the processes we currently have running organized by pid. * The keys are the pid running the application. * * <p>NOTE: This object is protected by its own lock, NOT the global * activity manager lock! */ final SparseArray<ProcessRecord> mPidsSelfLocked = new SparseArray<ProcessRecord>(); |
下面这幅图小节了上文的这些内容:
<img src="http://qiangbo-workspace.oss-... width="600"> |
关于应用组件
Processes and Threads 提到:
“当某个应用组件启动且该应用没有运行其他任何组件时,Android 系统会使用单个执行线程为应用启动新的
Linux 进程。”
因此,四大组件中的任何一个先起来都会导致应用进程的创建。下文我们就详细看一下,它们启动时,各自是如何导致应用进程的创建的。
PS:四大组件的管理本身又是一个比较大的话题,限于篇幅关系,这里不会非常深入的讲解,这里主要是讲解四大组件与进程创建的关系。
在应用程序中,开发者通过:
1.startActivity(Intent intent) 来启动Activity
2.startService(Intent service) 来启动Service
3.sendBroadcast(Intent intent) 来发送广播
4.ContentResolver 中的接口来使用ContentProvider
这其中,startActivity,startService和sendBroadcast还有一些重载方法。
其实这里提到的所有这些方法,最终都是通过Binder调用到ActivityManagerService中,由其进行处理的。
这里特别说明一下:应用进程和ActivityManagerService所在进程(即system_server进程)是相互独立的,两个进程之间的方法通常是不能直接互相调用的。
而Android系统中,专门提供了Binder框架来提供进程间通讯和方法调用的能力。
调用关系如下图所示:
<img src="http://qiangbo-workspace.oss-... width="600" > |
Activity与进程创建
在ActivityManagerService中,对每一个运行中的Activity都有一个ActivityRecord对象与之对应,这个对象记录Activity的详细状态。
ActivityManagerService中的startActivity方法接受Context.startActivity的请求,该方法代码如下:
@Override public final int startActivity(IApplicationThread caller, String callingPackage, Intent intent, String resolvedType, IBinder resultTo, String resultWho, int requestCode, int startFlags, ProfilerInfo profilerInfo, Bundle bOptions) { return startActivityAsUser(caller, callingPackage, intent, resolvedType, resultTo, resultWho, requestCode, startFlags, profilerInfo, bOptions, UserHandle.getCallingUserId()); } |
Activity的启动是一个非常复杂的过程。这里我们简单介绍一下背景知识:
1.ActivityManagerService中通过Stack和Task来管理Activity
2.每一个Activity都属于一个Task,一个Task可能包含多个Activity。一个Stack包含多个Task
3.ActivityStackSupervisor类负责管理所有的Stack
4.Activity的启动过程会牵涉到:
a.Intent的解析
b.Stack,Task的查询或创建
c.Activity进程的创建
d.Activity窗口的创建
e.Activity的生命周期调度
Activity的管理结构如下图所示:
<img src="http://qiangbo-workspace.oss-... width="500"> |
在Activity启动的最后,会将前一个Activity pause,将新启动的Activity resume以便被用户看到。
在这个时候,如果发现新启动的Activity进程还没有启动,则会通过startSpecificActivityLocked将其启动。整个调用流程如下:
1.ActivityManagerService.activityPaused
=>
2.ActivityStack.activityPausedLocked
=>
3.ActivityStack.completePauseLocked
=>
4.ActivityStackSupervisor.ensureActivitiesVisibleLocked
=>
5.ActivityStack.makeVisibleAndRestartIfNeeded
=>
6.ActivityStackSupervisor.startSpecificActivityLocked
=>
7.ActivityManagerService.startProcessLocked
8.ActivityStackSupervisor.startSpecificActivityLocked
关键代码如下:
void startSpecificActivityLocked(ActivityRecord r, boolean andResume, boolean checkConfig) { // Is this activity's application already running? ProcessRecord app = mService.getProcessRecordLocked(r.processName, r.info.applicationInfo.uid, true); r.task.stack.setLaunchTime(r); if (app != null && app.thread != null) { ... } mService.startProcessLocked(r.processName, r.info.applicationInfo, true, 0, "activity", r.intent.getComponent(), false, false, true); } |
这里的ProcessRecord app 描述了Activity所在进程。
Service与进程创建
Service的启动相对于Activity来说要简单一些。
在ActivityManagerService中,对每一个运行中的Service都有一个ServiceRecord对象与之对应,这个对象记录Service的详细状态。
ActivityManagerService中的startService方法处理Context.startServiceAPI的请求,相关代码:
@Override public ComponentName startService(IApplicationThread caller, Intent service, String resolvedType, String callingPackage, int userId) throws TransactionTooLargeException { ... synchronized(this) { final int callingPid = Binder.getCallingPid(); final int callingUid = Binder.getCallingUid(); final long origId = Binder.clearCallingIdentity(); ComponentName res = mServices.startServiceLocked(caller, service, resolvedType, callingPid, callingUid, callingPackage, userId); Binder.restoreCallingIdentity(origId); return res; } } |
这段代码中的mServices对象是ActiveServices类型的,这个类专门负责管理活动的Service。
启动Service的调用流程如下:
1.ActivityManagerService.startService
=>
2.ActiveServices.startServiceLocked
=>
3.ActiveServices.startServiceInnerLocked
=>
4.ActiveServices.bringUpServiceLocked
=>
5.ActivityManagerService.startProcessLocked
ActiveServices.bringUpServiceLocked会判断如果Service所在进程还没有启动,
则通过ActivityManagerService.startProcessLocked将其启动。相关代码如下:
// Not running -- get it started, and enqueue this service record // to be executed when the app comes up. if (app == null && !permissionsReviewRequired) { if ((app=mAm.startProcessLocked(procName, r.appInfo, true, intentFlags, "service", r.name, false, isolated, false)) == null) { String msg = "Unable to launch app " + r.appInfo.packageName + "/" + r.appInfo.uid + " for service " + r.intent.getIntent() + ": process is bad"; Slog.w(TAG, msg); bringDownServiceLocked(r); return msg; } if (isolated) { r.isolatedProc = app; } } |
这里的mAm 就是ActivityManagerService。
Provider与进程创建
在ActivityManagerService中,对每一个运行中的ContentProvider都有一个ContentProviderRecord对象与之对应,这个对象记录ContentProvider的详细状态。
开发者通过ContentResolver中的insert, delete, update, query这些API来使用ContentProvider。在ContentResolver的实现中,无论使用这里的哪个接口,ContentResolver都会先通过acquireProvider
这个方法来获取到一个类型为IContentProvider的远程接口。这个远程接口对接了ContentProvider的实现提供方。
同一个ContentProvider可能同时被多个模块使用,而调用ContentResolver接口的进程只是ContentProvider的一个客户端而已,真正的ContentProvider提供方是运行自身的进程中的,两个进程的通讯需要通过Binder的远程接口形式来调用。如下图所示:
<img src="http://qiangbo-workspace.oss-...
width="500">
ContentResolver.acquireProvider 最终会调用到ActivityManagerService.getContentProvider中,该方法代码如下:
@Override public final ContentProviderHolder getContentProvider( IApplicationThread caller, String name, int userId, boolean stable) { enforceNotIsolatedCaller("getContentProvider"); if (caller == null) { String msg = "null IApplicationThread when getting content provider " + name; Slog.w(TAG, msg); throw new SecurityException(msg); } // The incoming user check is now handled in checkContentProviderPermissionLocked() to deal // with cross-user grant. return getContentProviderImpl(caller, name, null, stable, userId); } |
而在getContentProviderImpl这个方法中,会判断对应的ContentProvider进程有没有启动,
如果没有,则通过startProcessLocked方法将其启动。
Receiver与进程创建
开发者通过Context.sendBroadcast接口来发送广播。ActivityManagerService.broadcastIntent
方法了对应广播发送的处理。
广播是一种一对多的消息形式,广播接受者的数量是不确定的。因此发送广播本身可能是一个很耗时的过程(因为要逐个通知)。
在ActivityManagerService内部,是通过队列的形式来管理广播的:
1.BroadcastQueue 描述了一个广播队列
2.BroadcastRecord 描述了一个广播事件
在ActivityManagerService中,如果收到了一个发送广播的请求,会先创建一个BroadcastRecord接着将其放入BroadcastQueue中。
然后通知队列自己去处理这个广播。然后ActivityManagerService自己就可以继续处理其他请求了。
广播队列本身是在另外一个线程处理广播的发送的,这样保证的ActivityManagerService主线程的负载不会太重。
在BroadcastQueue.processNextBroadcast(boolean fromMsg)
方法中真正实现了通知广播事件到接受者的逻辑。在这个方法,如果发现接受者(即BrodcastReceiver)还没有启动,便会通过ActivityManagerService.startProcessLocked
方法将其启动。相关如下所示:
final void processNextBroadcast(boolean fromMsg) { ... // Hard case: need to instantiate the receiver, possibly // starting its application process to host it. ResolveInfo info = (ResolveInfo)nextReceiver; ComponentName component = new ComponentName( info.activityInfo.applicationInfo.packageName, info.activityInfo.name); ... // Not running -- get it started, to be executed when the app comes up. if (DEBUG_BROADCAST) Slog.v(TAG_BROADCAST, "Need to start app [" + mQueueName + "] " + targetProcess + " for broadcast " + r); if ((r.curApp=mService.startProcessLocked(targetProcess, info.activityInfo.applicationInfo, true, r.intent.getFlags() | Intent.FLAG_FROM_BACKGROUND, "broadcast", r.curComponent, (r.intent.getFlags()&Intent.FLAG_RECEIVER_BOOT_UPGRADE) != 0, false, false)) == null) { // Ah, this recipient is unavailable. Finish it if necessary, // and mark the broadcast record as ready for the next. Slog.w(TAG, "Unable to launch app " + info.activityInfo.applicationInfo.packageName + "/" + info.activityInfo.applicationInfo.uid + " for broadcast " + r.intent + ": process is bad"); logBroadcastReceiverDiscardLocked(r); finishReceiverLocked(r, r.resultCode, r.resultData, r.resultExtras, r.resultAbort, false); scheduleBroadcastsLocked(); r.state = BroadcastRecord.IDLE; return; } mPendingBroadcast = r; mPendingBroadcastRecvIndex = recIdx; } } |
至此,四大组件的启动就已经分析完了。
结束语
进程管理本身是一个非常大的话题,本文讲解了Android系统中进程创建的相关内容。进程启动之后该如何管理就是下一篇文章要讲解的内容了。
敬请期待。 |