1. 解决线上.NET应用程序的如下问题:

  • 崩溃
  • CPU高
  • 程序异常
  • 程序Hang死

2. 安装WinDbg:

http://msdn.microsoft.com/en-us/windows/hardware/gg463009.aspx

3. 配置WinDbg:

运行WinDbg->菜单->File->Symbol File Path->按照下面的方法设置_NT_SYMBOL_PATH变量:
在弹出的框中输入“C:\MyCodesSymbols; SRV*C:\MyLocalSymbols*http://msdl.microsoft.com/download/symbols”(按照这样设置,WinDbg将先从本地文件夹C:\MyCodesSymbols中查找Symbol,如果找不到,则自动从MS的Symbol Server上下载Symbols)。另一种做法是从这个Symbol下载地址中http://www.microsoft.com/whdc/devtools/debugging/symbolpkg.mspx,下载相应操作系统所需要的完整的Symbol安装包,并进行安装,4. 利用WinDbg里的adplus来获取dump文件。
 Dump文件是进程的内存镜像。可以把程序的执行状态通过调试器保存到dump文件中。
在WinDbg安装目录里可以找到adplus.exe,把他拖入到命令行中,然后用命令
adplus.exe -hang -pn test.exe -o c:\dumps  // 抓取当前的dump文件
adplus.exe -crash -pn test.exe -o c:\dumps  // 监听应用程序,当crash时,获取dump文件
命令-pn :应用程序名,-p:应用程序pid,-odump文件输出路径
5. 利用WinDbg加载dump文件加载调试器
运行WinDbg->菜单->File->Open Cresh dump 打开dump文件,并加载.net调试器
.loadby sos mscorwks  .Net 3.5版本及以下
.loadby sos clr  .Net 4.0
如果服务器的.Net版本与本机不匹配需要服务器版本的mscordacwks.dll文件
并设置.sympath = mscordacwks_x86_x86_2.0.50727.3607.dl
6. WinDbg的基本命令
help  sos指令帮助
!threads  显示所有线程
!dumpheap  显示托管堆的信息
!clrstack  显示调用栈
!dumpobj  显示一个对象的内容
!dumparray  显示数组
!syncblk  显示同步块
!runaway  显示线程cpu时间
!gcroot  跟踪对象内存引用
!pe  打印异常
7. WinDbg的使用
当我在Form中执行这段代码:
public Form1(){
			InitializeComponent();
			AppDomain.CurrentDomain.UnhandledException += new UnhandledExceptionEventHandler(CurrentDomain_UnhandledException);
		}
	private void UnhandledExceptionProc(object obj){
			try {
				throw new Exception("1st chance");
			} catch (Exception) {
				MessageBox.Show("after 1st");
			}
			int d = 0;
			int n = 1 / d;
}
并活动dump文件

用windbg打开dump文件后输入-pe:可以看到问题的所在。
异常如此重要,所以操作系统提供了对应的调试功能,可以使用调试器来检视异常。异常发生后,操作系统在调用用户态程序的异常处理函数前,会检查当前用户态程序是否有调试器加载。如果有,那么操作系统会首先把异常信息发送给调试器,让调试器有观察异常的第一次机会,所以也叫做first chance exception,调试器处理完毕后,操作系统才让用户态程序来处理。
如果用户态程序处理了这个异常,就没调试器什么事了。否则,程序在unhandled exception崩溃前,操作系统会给调试器第二次观察异常的机会,所以也叫做second chance exception。
《Windows用户态程序高效排错》
分析以下代码:可以看出DummyObject 会占用很多内存,甚至导致内存溢出
	private void MemeryLeakProc(object obj)
		{
			while (true) {
				for (int i = 0; i < 100 * 1024; i++) {
					DummyObject o = new DummyObject();
					list.Add(o);
				}
				Thread.Sleep(1000);
			}
		}
windbg命令:!dumpheap –stat 统计堆栈内存
线程Hang住的常见原因
-线程池或工作线程集中在某个耗时的工作当中,或者被其他线程锁住
核心问题,找到被hang住的线程
!threads
~*e!clrstack
!synblk
lock (syncRoot) {
				int tp;
				int io;
				//ThreadPool.GetMaxThreads(out tp, out io);
				for (int i = 0; i < 100; i++) {
					Thread hangThread = new Thread(HangProc);
					hangThread.Start();
				}
				MessageBox.Show("Press to release lock");
			}  private void HangProc(object obj)
  {
   lock (syncRoot) {
    n = 0;
   }
  }
CPU高 
-如果与业务量没有提升,有线程在长时间的处理
核心问题,找到占用CPU的线程
!runaway
~*e!clrstack
 
线程死锁出现的情况:
两个锁A,B,
一个线程已经拿到锁A,申请锁B,
另一个线程已经拿到锁B,申请锁A
核心问题:找到锁定的线程
!threads
!syncblk
~*e!clrstack
 
•两条指令可以解决大部分的问题
•!dumpheap –stat
•~*e!clrstack