LOG 解析方法
1、log的大体分析步骤
1.1、android 主要产生的问题类型
1)程序异常退出 , uncaused exception
2)程序强制关闭 ,Force Closed (简称FC)
3)程序无响应 , Application No Response (简称ANR)
1.2、看到log大体分析思路
(1)如果是ANR问题,则搜索“ANR”关键字,快速定位到关键事件信息。如果是ForceClosed和其他异常退出信息,则搜索“Fatal”关键词,快速定位到关键事件信息。
(2)定位到关键事件信息后,如果信息还不够明确,则搜索应用程序的虚拟机信息,查看具体的进程和线程跟踪日志,来定位到代码。
2、log 信息的种类
android.util.Log常用的方法有以下5个
(1)Log.v 的调试颜色为黑色的,任何消息都会输出,这里的v代表verbose啰嗦的意思,平时使用就是Log.v(“”,”“);
(2)Log.d的输出颜色是蓝色的,仅输出debug调试的意思,但他会输出上层的信息,过滤起来可以通过DDMS的Logcat标签来选择。
(3)Log.i的输出为绿色,一般提示性的消息information,它不会输出Log.v和Log.d的信息,但会显示i、w和e的信息。
(4)Log.w的意思为橙色,可以看作为warning警告,一般需要我们注意优化Android代码,同时选择它后还会输出Log.e的信息。
(5)Log.e为红色,可以想到error错误,这里仅显示红色的错误信息,这些错误就需要我们认真的分析,查看栈的信息了。
3、制造ANR——BUG实例解析log
3.1、人为制造一个ANR
# adb shell
# cd data/app
# monkey -p com.xxx.xxx -v 3000 (com.xxx.xxx是你应用程序的包名,如果想知道monkey详细用法,执行 monkey help )
生成的log文件一般在真机的/data/log 下面。
3.2、log文件分析
Log文件很长,但是主要由三大块组成
3.2.1系统基本信息,包括内存,CPU,进程队列,虚拟内存,垃圾回收机制等信息。
1、 ———MEMORY INFO (命令 cat /proc/meminfo)
2、 ———CPU INFO(命令 top -n 1 -d 1 –m 30 -t)
3、 ———-PAOCRANK(命令 procrank)
4、 ———–VITUAL MEMORY STATS(命令 cat /proc/vmstat)
5、 ————VMALLOC INFO (命令 cat /proc/vmallocinfo)
3.2.2、事件信息,也是我们主要分析的信息
1、———–VMALLOC INFO(命令 cat /proc/vmallocinfo)
2、———–EVENT INFO(命令 cat /proc/vmallocinfo)
3.2.3、虚拟机信息,包括进程的,线程的跟踪信息,这是用来跟踪进程和线程的具体的好地方。
1、———VM TRACES JUST NOW (/data/anr/traces.txt.bugreport:2011-01-15 16:49:02)
2、———-VM TRANCES AT LAST ANR (/data/anr/trances.txt.bugreport:2011-01-15 16:49:02)
3、————导出虚拟机信息———(adb pull /data/anr/traces.txt)
3.3、log三大模块,具体格式实例
3.3.1、系统基本信息,包括内存,CPU,进程队列,虚拟内存,垃圾回收机制等信息
格式如下:
——MEMORY INFO (命令 cat /proc/meminfo) ——
MemTotal: 347076 kB //总计物理内存的大小
MemFree: 56408 kB //可用内存有多少
Buffers: 7192 kB //磁盘缓存内存的大小
Cached: 104064 kB
SwapCached: 0 kB
Active: 192592 kB
Inactive: 40548 kB
Active(anon): 129040 kB
Inactive(anon): 1104 kB
Active(file): 63552 kB
Inactive(file): 39444 kB
Unevictable: 7112 kB
Mlocked: 0kB
SwapTotal: 0 kB
SwapFree: 0 kB
Dirty: 44kB
Writeback: 0 kB
AnonPages: 129028 kB
Mapped: 73728 kB
Shmem: 1148kB
Slab: 13072kB
SReclaimable: 4564 kB
SUnreclaim: 8508 kB
KernelStack: 3472 kB
PageTables: 12172 kB
NFS_Unstable: 0 kB
Bounce: 0kB
WritebackTmp: 0 kB
CommitLimit: 173536 kB
Committed_AS: 7394524 kB
VmallocTotal: 319488 kB
VmallocUsed: 90752 kB
VmallocChunk: 181252 kB
3.3.2、事件信息, 也是我们主要分析的信息 。
——VMALLOC INFO (/proc/vmallocinfo) ——
——EVENT INFO (/proc/vmallocinfo) ——
格式如下:
——SYSTEM LOG (logcat -b system -v time -d *:v) ——
01-1516:41:43.671 W/PackageManager( 2466): Unknown permissioncom.wsomacp.permission.PROVIDER in package com.android.mms
01-1516:41:43.671 I/ActivityManager( 2466): Force stopping packagecom.android.mms uid=10092
01-1516:41:43.675 I/UsageStats( 2466): Something wrong here, didn’t expectcom.sec.android.app.twlauncher to be paused
01-1516:41:44.108 I/ActivityManager( 2466): Start proccom.sec.android.widgetapp.infoalarm for servicecom.sec.android.widgetapp.infoalarm/.engine.DataService: pid=20634uid=10005 gids={3003, 1015, 3002}
01-1516:41:44.175 W/ActivityManager( 2466): Activity pause timeout forHistoryRecord{48589868com.sec.android.app.twlauncher/.Launcher}
01-1516:41:50.864 I/KeyInputQueue( 2466): Input event
01-1516:41:50.866 D/KeyInputQueue( 2466): screenCaptureKeyFlag setting0
01-1516:41:50.882 I/PowerManagerService( 2466): Ulight 0->7|0
01-1516:41:50.882 I/PowerManagerService( 2466): Setting target 2: cur=0.0target=70 delta=4.6666665 nominalCurrentValue=0
01-1516:41:50.882 I/PowerManagerService( 2466): Scheduling lightanimator!
01-1516:41:51.706 D/PowerManagerService( 2466): enableLightSensortrue
01-1516:41:51.929 I/KeyInputQueue( 2466): Input event
01-1516:41:51.933 W/WindowManager( 2466): No focus window, dropping:KeyEvent{action=0 code=26 repeat=0 meta=0 scancode=26mFlags=9}
3.3.3、虚拟机信息, 包括进程的,线程的跟踪信息,这是用来跟踪进程和线程具体点的好地方。
——VM TRACES JUST NOW (/data/anr/traces.txt.bugreport: 2011-01-1516:49:02) ——
——VM TRACES AT LAST ANR (/data/anr/traces.txt: 2011-01-15 16:49:02)——
格式如下:
—–pid 21161 at 2011-01-15 16:49:01 —–
Cmdline: com.android.mms
DALVIKTHREADS:
“main”prio=5 tid=1 NATIVE
|group=”main” sCount=1 dsCount=0 s=N obj=0x4001d8d0self=0xccc8
|sysTid=21161 nice=0 sched=0/0 cgrp=default handle=-1345017808
|schedstat=( 4151552996 5342265329 10995 )
atandroid.media.MediaPlayer._reset(Native Method)
atandroid.media.MediaPlayer.reset(MediaPlayer.Java:1218)
atandroid.widget.VideoView.release(VideoView.java:499)
atandroid.widget.VideoView.access2100(VideoView.java:50)atandroid.widget.VideoView6.surfaceDestroyed(VideoView.java:489)
atandroid.view.SurfaceView.reportSurfaceDestroyed(SurfaceView.java:572)
atandroid.view.SurfaceView.updateWindow(SurfaceView.java:476)
atandroid.view.SurfaceView.onWindowVisibilityChanged(SurfaceView.java:206)
atandroid.view.View.dispatchDetachedFromWindow(View.java:6082)
atandroid.view.ViewGroup.dispatchDetachedFromWindow(ViewGroup.java:1156)
atandroid.view.ViewGroup.removeAllViewsInLayout(ViewGroup.java:2296)
atandroid.view.ViewGroup.removeAllViews(ViewGroup.java:2254)
atcom.android.mms.ui.SlideView.reset(SlideView.java:687)
atcom.android.mms.ui.SlideshowPresenter.presentSlide(SlideshowPresenter.java:189)
atcom.android.mms.ui.SlideshowPresenter3.run(SlideshowPresenter.java:531)atandroid.os.Handler.handleCallback(Handler.java:587)atandroid.os.Handler.dispatchMessage(Handler.java:92)atandroid.os.Looper.loop(Looper.java:123)atandroid.app.ActivityThread.main(ActivityThread.java:4627)atjava.lang.reflect.Method.invokeNative(NativeMethod)atjava.lang.reflect.Method.invoke(Method.java:521)atcom.android.internal.os.ZygoteInitMethodAndArgsCaller.run(ZygoteInit.java:858)
atcom.android.internal.os.ZygoteInit.main(ZygoteInit.java:616)
atdalvik.system.NativeStart.main(NativeMethod)
4、log分析步骤
4.1 、log分析一般步骤
(1)如果是ANR 有问题,则搜索“ANR ”关键词
(2)如果是ForceClosed和其他异常退出信息,则搜索“Fatal”关键词,快速定位到关键事件信息。
(3)定位到关键事件后,如果信息还不明确,则可以搜索应用程序包的虚拟机信息,查看具体的进程和线程跟踪日志来定位代码。
4.2、log实例分析
4.2.1、打开log,定位到关键事件信息
因为是ANR 错误,因此搜索 “ANR ”,注意ARN后加空格,可以屏蔽掉不少无效的信息。
定位到关键事件信息:
01-1516:49:02.433 E/ActivityManager( 2466): ANR in com.android.mms(com.android.mms/.ui.SlideshowActivity)
01-1516:49:02.433 E/ActivityManager( 2466): Reason:keyDispatchingTimedOut
01-1516:49:02.433 E/ActivityManager( 2466): Load: 0.6 / 0.61 / 0.42
01-1516:49:02.433 E/ActivityManager( 2466): CPU usage from 1337225ms to57ms ago:
01-1516:49:02.433 E/ActivityManager( 2466): sensorserver_ya:8% = 0% user + 8% kernel / faults: 40 minor
……
01-1516:49:02.433 E/ActivityManager( 2466): -com.android.mms:0% = 0% user + 0% kernel
01-1516:49:02.433 E/ActivityManager( 2466): -flush-179:8: 0% =0% user + 0% kernel
01-1516:49:02.433 E/ActivityManager( 2466): TOTAL: 25% = 10% user + 14%kernel + 0% iowait + 0% irq + 0% softirq
01-1516:49:02.436 I/ ( 2466):dumpmesg >”/data/log/dumpstate_app_anr.log”
4.2.2、用直白语言翻译部分log信息
(1)01-15 16:49:02.433 E/ActivityManager( 2466): ANR in com.android.mms(com.android.mms/.ui.SlideshowActivity)
注:在16时49分02秒433毫秒,ActivityManager(进程号2466)发生如下错误:在com.android.mms包下面的.ui.SlideshowActivity无响应。
(2)01-1516:49:02.433 E/ActivityManager( 2466): Reason:keyDispatchingTimedOut
注:••••,原因:keyDispatchingTimeOut-按键分配超时
(3)01-1516:49:02.433 E/ActivityManager( 2466): Load: 0.6 / 0.61 /0.42
注:5分钟,10分钟,15分钟内的平均负载分别为:0.6, 0.61 ,0.42
分析log得知,出现ANR是点击按钮时候处理不过来按钮事件,导致超时无响应。我们知道ActivityManager是重载dispatchTouchEvent(MontionEvent)来处理点击事件。到此我们只是猜想,并没有实际佐证。
于是我们接着分析虚拟机信息,搜索“DalvikThread”关键词,快速定位到本应用程序的虚拟机信息日志。
4.2.3、根据定位的事件信息,接着分析虚拟机信息
搜索“DalvikThread”关键词,快速定位到本应用程序的虚拟机信息日志,如下:
—–pid 2922 at 2011-01-13 13:51:07 —–
Cmdline: com.android.mms
DALVIKTHREADS:
“main”prio=5 tid=1 NATIVE
|group=”main” sCount=1 dsCount=0 s=N obj=0x4001d8d0self=0xccc8
|sysTid=2922 nice=0 sched=0/0 cgrp=default handle=-1345017808
|schedstat=( 3497492306 15312897923 10358 )
atandroid.media.MediaPlayer._release(Native Method)
atandroid.media.MediaPlayer.release(MediaPlayer.java:1206)
atandroid.widget.VideoView.stopPlayback(VideoView.java:196)
atcom.android.mms.ui.SlideView.stopVideo(SlideView.java:640)
atcom.android.mms.ui.SlideshowPresenter.presentVideo(SlideshowPresenter.java:443)
atcom.android.mms.ui.SlideshowPresenter.presentRegionMedia(SlideshowPresenter.java:219)
atcom.android.mms.ui.SlideshowPresenter4.run(SlideshowPresenter.java:516)atandroid.os.Handler.handleCallback(Handler.java:587)atandroid.os.Handler.dispatchMessage(Handler.java:92)atandroid.os.Looper.loop(Looper.java:123)atandroid.app.ActivityThread.main(ActivityThread.java:4627)atjava.lang.reflect.Method.invokeNative(NativeMethod)atjava.lang.reflect.Method.invoke(Method.java:521)atcom.android.internal.os.ZygoteInitMethodAndArgsCaller.run(ZygoteInit.java:858)
atcom.android.internal.os.ZygoteInit.main(ZygoteInit.java:616)
atdalvik.system.NativeStart.main(Native Method)
“BinderThread #3” prio=5 tid=11 NATIVE
|group=”main” sCount=1 dsCount=0 s=N obj=0x4837f808self=0x242280
|sysTid=3239 nice=0 sched=0/0 cgrp=default handle=2341032
|schedstat=( 32410506 932842514 164 )
atdalvik.system.NativeStart.run(Native Method)
“AsyncQueryWorker”prio=5 tid=9 WAIT
|group=”main” sCount=1 dsCount=0 s=N obj=0x482f4b80self=0x253e10
|sysTid=3236 nice=0 sched=0/0 cgrp=default handle=2432120
|schedstat=( 3225061 26561350 27 )
atjava.lang.Object.wait(Native Method)
-waiting on <0x482f4da8> (a android.os.MessageQueue)
atjava.lang.Object.wait(Object.java:288)
atandroid.os.MessageQueue.next(MessageQueue.java:146)
atandroid.os.Looper.loop(Looper.java:110)
atandroid.os.HandlerThread.run(HandlerThread.java:60)
“Thread-9”prio=5 tid=8 WAIT
|group=”main” sCount=1 dsCount=0 s=N obj=0x4836e2b0self=0x25af70
|sysTid=2929 nice=0 sched=0/0 cgrp=default handle=2370896
|schedstat=( 130248 4389035 2 )
atjava.lang.Object.wait(Native Method)
-waiting on <0x4836e240> (a java.util.ArrayList)
atjava.lang.Object.wait(Object.java:288)
atcom.android.mms.data.ContactContactsCacheTaskStack$1.run(Contact.java:488)
atjava.lang.Thread.run(Thread.java:1096)
“BinderThread #2” prio=5 tid=7 NATIVE
|group=”main” sCount=1 dsCount=0 s=N obj=0x482f8ca0self=0x130fd0
|sysTid=2928 nice=0 sched=0/0 cgrp=default handle=1215968
|schedstat=( 40610049 1837703846 195 )
atdalvik.system.NativeStart.run(Native Method)
“BinderThread #1” prio=5 tid=6 NATIVE
|group=”main” sCount=1 dsCount=0 s=N obj=0x482f4a78self=0x128a50
|sysTid=2927 nice=0 sched=0/0 cgrp=default handle=1201352
|schedstat=( 40928066 928867585 190 )
atdalvik.system.NativeStart.run(Native Method)
“Compiler”daemon prio=5 tid=5 VMWAIT
|group=”system” sCount=1 dsCount=0 s=N obj=0x482f1348self=0x118960
|sysTid=2926 nice=0 sched=0/0 cgrp=default handle=1149216
|schedstat=( 753021350 3774113668 6686 )
atdalvik.system.NativeStart.run(Native Method)
“JDWP”daemon prio=5 tid=4 VMWAIT
|group=”system” sCount=1 dsCount=0 s=N obj=0x482f12a0self=0x132940
|sysTid=2925 nice=0 sched=0/0 cgrp=default handle=1255680
|schedstat=( 2827103 29553323 19 )
atdalvik.system.NativeStart.run(Native Method)
“SignalCatcher” daemon prio=5 tid=3 RUNNABLE
|group=”system” sCount=0 dsCount=0 s=N obj=0x482f11e8self=0x135988
|sysTid=2924 nice=0 sched=0/0 cgrp=default handle=1173688
|schedstat=( 11793815 12456169 7 )
atdalvik.system.NativeStart.run(Native Method)
“HeapWorker”daemon prio=5 tid=2 VMWAIT
|group=”system” sCount=1 dsCount=0 s=N obj=0x45496028self=0x135848
|sysTid=2923 nice=0 sched=0/0 cgrp=default handle=1222608
|schedstat=( 79049792 1520840200 95 )
atdalvik.system.NativeStart.run(Native Method)
—–end 2922 —–
每一段都是一个线程,我们观看线程号为1的主线程,分析:
atcom.android.mms.ui.SlideshowPresenter$3.run(SlideshowPresenter.java:531)
定位到代码:
mHandler.post(newRunnable() {
public void run() {
try {
presentRegionMedia(view,(RegionMediaModel) model, dataChanged);
} catch (OMADRMException e) {
Log.e(TAG, e.getMessage(), e);
Toast.makeText(mContext,
mContext.getString(R.string.insufficient_drm_rights),
Toast.LENGTH_SHORT).show();
} catch (IOException e){
Log.e(TAG, e.getMessage(), e);
Toast.makeText(mContext,
mContext.getString(R.string.insufficient_drm_rights),
Toast.LENGTH_SHORT).show();
}
}
很清楚了,Handler.post方法之后执行时间太长的问题。 继续看presentRegionMedia(view,(RegionMediaModel) model, dataChanged);方法, 发现最终是调用的framework中MediaPlayer.stop方法。
至此,我们的日志分析算是告一段落。 可以开始思考解决办法了。
5、 思考解决方法
5.1、明确问题所在
结合上面的分析,我们知道问题似乎是线程队列中某个操作presentRegionMedia(view,(RegionMediaModel) model, dataChanged);执行时间太长所导致的界面无响应。
从上面这段代码中,我们可以看出,在做播放器控制按钮(比如播放,暂停,停止)等操作的时候, 是通过Handler.post(Runnable)来放到消息队列中, 排序来处理 。 那么之所以这里出现了无响应,很有可能是因为某一项控制操作太耗时或者耗资源。 这时候又接收到新的要处理的消息,就会处理不过来了。 因此我试图让队列中同时只有一个控制播放器按钮的任务在。 我对代码做了如下改动:
Runnabler = new Runnable(){
public void run() {
try {
presentRegionMedia(view,(RegionMediaModel) model, dataChanged);
} catch (OMADRMException e) {
Log.e(TAG, e.getMessage(), e);
Toast.makeText(mContext,
mContext.getString(R.string.insufficient_drm_rights),
Toast.LENGTH_SHORT).show();
} catch (IOException e){
Log.e(TAG, e.getMessage(), e);
Toast.makeText(mContext,
mContext.getString(R.string.insufficient_drm_rights),
Toast.LENGTH_SHORT).show();
}
}
mHandler.removeCallbacks(r);
mHandler.post(r);
代码慢慢看,思路很简单:其实就是在postRunnable之前先清除队列中已存的相同Runnable实例。 这样可以保证同时队列中只有一个操作在处理 。
很遗憾,不生效。:
再来,我将整个模式改为message再试试,核心代码如下 :
if(mHandler.hasMessages(MEDIA_PLAY_WHAT_MESSAGEFLAG))
{
return ;
}
Messagemsg = mHandler.obtainMessage() ;
msg.what= this.MEDIA_PLAY_WHAT_MESSAGEFLAG ;
msg.obj= mMeidaPlayMessageObj ;
mHandler.sendMessageDelayed(msg,1000) ;
代码慢慢看,思路也很简单,通过发消息的方式, 先检测如果有相关消息队列,就直接跳出函数,不做任何处理,否则延迟一秒后再向队列发送一条消息 。
为何我用了1秒这个这么长的时间呢,因为这么长时间如果都处理不了,那就不是压力测试的问题了,而是方法本身的问题了,这也是通过排除法来试图排除是因为点击屏幕过快产生的问题。
编译,再试 ,很不辛,又不生效
现在问题很明显了:不是压力测试时候点击过快导致的ANR,而是某些方法本身有问题。
通过之前我们的日志
—–pid 2922 at 2011-01-13 13:51:07 —–
Cmdline: com.android.mms
DALVIKTHREADS:
“main”prio=5 tid=1 NATIVE
|group=”main” sCount=1 dsCount=0 s=N obj=0x4001d8d0self=0xccc8
|sysTid=2922 nice=0 sched=0/0 cgrp=default handle=-1345017808
|schedstat=( 3497492306 15312897923 10358 )
atandroid.media.MediaPlayer._release(Native Method)
atandroid.media.MediaPlayer.release(MediaPlayer.java:1206)
atandroid.widget.VideoView.stopPlayback(VideoView.java:196)
atcom.android.mms.ui.SlideView.stopVideo(SlideView.java:640)
很容易就知道了问题出在每次执行完了MediaPlayer.stop()方法调用之后会调用release()来释放播放器资源。 而这个方法中又死在了_release()方法上。 这是一个Native方法。
因此,真相大白 ,问题是在Framework层的MediaPlayer调用的Native方法_release()上。
5.2、问题总结
通过读log一步步分析,找到问题点,排除分析法,本问题不是多线程占用资源问题,不是压力测试导致,是调用本地方法时出错。
一般log分析的思路均可按照上述步骤,具体错误事项还需具体对待。
参考文档:
Android输出日志Log类
Android Log分析之法
Android 分析log
对Android log异常分析方法