前段时间做DPM的项目很郁闷的又遇到BUG了,下面是一些信息,希望能给大家一些启发
王先生,您好
基于我们对您的问题的深入分析和实验,我们目前有以下进展,供您参考。
问题描述
==========
DPM Management Console在安装Agent是会报错退出。提示错误917。安装无法完成。
解决方案
==========
根据我们Bugcheck数据库中的描述,此问题只发生在Windows XP的系统上,而且意外退出的问题计划会在SP1中修复。
我们在实验环境中成功的在XP系统上重现的您的问题,DPM Service不仅在安装agent的时候出错,同时在安装失败异常退出后,在再一次打开控制台的时候异常退出,原因是DPM Service数据库中仍有向远程客户端安装agent的任务信息,会自动尝试重新连接有问题的客户端。此现象与期望一致。
在实验环境中,当我们升级最新SP1补丁包后,DPM 在尝试安装后提示没有WMI权限而失败,不再出现异常退出的问题。
我们建议
1、 升级DPM SP1补丁包,升级SP1补丁后DPM不会异常退出,但是没有WMI权限的XP机器上安装agent仍然会失败。
2、 对于没有WMI权限安装失败的XP系统,检查安装DPM所用的用户是否在XP系统的Administrators组中,您可以在AD设置中做到这一点。
3、 检查客户端WMI权限设置,使用wmimgmt连接客户端,在Security Tab中确认权限设置。
4、 使用运行->wbemtest,测试是否能连接到客户端WMI服务,在wbemtest连接中,输入DPM安装agent时输入的用户名和密码,测试连接是否报告错误。
问题分析
==========
在多次检查了收取的报告后,我们确认了任务失败以及DPM服务意外关闭,都是由于远程客户端没有WMI管理权限造成的,错误ID: ManagementException with code[0x80041003] and message[访问遭到拒绝 ].
我们在bug记录中,发现这个bug已经被提交并处理了
Data Lifecycle Server 35162 - [Engine]unhandled exception on AC install to XP box
Status
Status: Closed
SubStatus: Fix ready
Assigned to: Closed
Issue type: Code Defect-General
ETA:
All TCs Run ETA:
Severity: 1
Priority: 0
Date: 5/29/2008
Project
Triage: Triage
Release: V2
Milestone: SP1
Install Agent on XP box where it fails with ACCESS_DENIED
It fails with ManagementException which is not handled.
Expected: No crash
2/21/08 6:28 AM: Edited by marionc
This bug needs to have a fix not just a CMD file workaround.
DPM Engine and MMC does not need to be crashing because a bit in the DB is wrong. That needs to be an Alert on the Alert tab telling customers that the DB is corrupt, and can be fixed by running DPMSync 朣ync.
2/21/08 9:49 PM: Edited by krisnaru
2/21/08 10:16 PM: Edited by krisnaru
BBpack is reviwed. Change is done in AMTE.dll.
2/26/08 5:36 AM: Edited by krisnaru
Reviewed bbpack is at
http://www.cnblogs.com/kksip/admin/file://kris666/bbpack/sp1/35162.cmd
2/26/08 5:37 AM: Edited by krisnaru
2/29/08 2:57 AM: Edited by esdbuild
Change # 59212 was made in the DLS Version 1 branch by krisnaru for this bug
See
http://esdbuild/sdb/describe.aspx?server=5&change=59212 for more details.
Check-in Comments:
Unhandled exceptions are handled now
2/29/08 2:59 AM: Resolved as Fixed by krisnaru
5/29/08 5:41 AM: Closed by muralini
DPM服务在没有WMI权限的XP系统上安装agent会出现异常,任务执行步骤如下:
1、 任务开始,制定任务安装计划 [GenerateWorkplan(job=5401210d-4b3d-48a4-b27e-2101e6285b9b)]
2、 任务执行,检查远程系统状态
a)检查对方系统类型,确定是32位还是64位系统 -> 失败 [CheckSystemType: ManagementException with code[0x80041003] and message[访问遭到拒绝 ].]
3、 生成Waston错误报告
4、 报告任务失败 [MSDPM AgentInstallationFailure Code:[AMHostWmiAccessDenied], DetailedCode:[-2147217405], DetailedErrorCode:[], DetailedSource:[WindowsAPI], DlsErrorCode:[402]]
5、 执行任务失败流程 [FailTask]
a)报告失败任务的信息:
TaskID : bbde2bd9-4015-431a-9f83-b1ba66705b74 serverName finltd-zhangxj.beijing.cnooc.corp
b)检查任务状态
c)将失败的计算机从本地用户组中删除 [Removing computer from group[Distributed COM Users] on local server.]
d)将失败的计算机从本地用户组中删除Removing computer from group[MSDPMTrustedMachines] on local server.]
e)将失败的计算机从本地用户组中删除[Removing computer from group[DPMRADmTrustedMachines] on local server.]
f)撤销DPM Server在远程计算机上的权限 [REmoving computer[MS-DPM-SRV-LTD.beijing.cnooc.corp] from COM security on server[finltd-zhangxj.beijing.cnooc.corp].]
g)撤销过程中失败意外退出 [Caught unhandled exception: System.Management.ManagementException: 访问遭到拒绝]
6、 由于遇到一个不能处理的异常导致DPM服务意外退出。
步骤2与步骤5-g的失败都是由于远程计算机WMI拒绝连接。DPM在安装agent的过程中首先遇到WMI拒绝连接造成任务失败,在处理失败任务的过程中再一次遇到WMI拒绝连接而以外退出。
前一封邮件:
王先生,您好
对于DPM服务器无法正常使用的问题(Case-ID: SRS081014600053),以下有关我们目前进展情况的报告,供您参考。
问题描述
==========
DPM Management Console在安装Agent是会报错退出。提示错误917。安装无法完成。
问题分析
==========
出现问题后,我们查看了系统日志以及应用程序日志。错误的原因是由于在向客户端安装agent的过程中。系统服务DPM Service异常退出,造成了DPM Management Console无法与DPM Service通信,并报告917错误退出。
在系统日志中可以看到如下错误:
Event Type: Error
Event Source: Service Control Manager
Event Category: None
Event ID: 7031
Date: 2008-10-14
Time: 17:51:12
User: N/A
Computer: MS-DPM-SRV-LTD
Description:
The DPM service terminated unexpectedly. It has done this 3 time(s). The following corrective action will be taken in 100 milliseconds: 重新启动服务.
我们使用MPSREPORT_DPM跟踪安装的过程,收取了进一步日志文件,在对安装agent过程中的日志进行分析后我们怀疑DPM Service异常退出是由于DPM Service无法对客户端DisableDcom操作引起的。我们在tracelog中发现了DPM Service抛出了一个未处理的异常System.Management.ManagementException
Caught unhandled exception: System.Management.ManagementException: 访问遭到拒绝
在 System.Management.ManagementException.ThrowWithExtendedInfo(ManagementStatus errorCode)
在 System.Management.ManagementScope.InitializeGuts(Object o)
在 System.Management.ManagementScope.Initialize()
在 System.Management.ManagementObject.Initialize(Boolean getObject)
在 System.Management.ManagementObject.InvokeMethod(String methodName, Object[] args)
在 Microsoft.Internal.EnterpriseStorage.Dls.AgentManager.Win32.LocalGroup.Win32LocalGroup.RemoveComputerFromComSecurity(FqMachineName server, Byte[] sid_arr)
在 Microsoft.Internal.EnterpriseStorage.Dls.AgentManager.Win32.LocalGroup.Win32LocalGroup.RemoveComputerFromComSecurity(FqMachineName server, FqMachineName computerName)
在 Microsoft.Internal.EnterpriseStorage.Dls.AgentManager.ACInstallMachine.JustDisableRemoteDcom(Message msg)
在 Microsoft.Internal.EnterpriseStorage.Dls.AgentManager.AMFsm.Impersonating(Message msg, Action action)
在 Microsoft.Internal.EnterpriseStorage.Dls.AgentManager.ACInstallMachine.DisableRemoteDcom(Message msg)
在 Microsoft.Internal.EnterpriseStorage.Dls.AgentManager.ACInstallMachine.CleanUp(Message msg)
在 Microsoft.Internal.EnterpriseStorage.Dls.AgentManager.ACInstallMachine.FailTask(Message msg)
在 Microsoft.Internal.EnterpriseStorage.Dls.TaskExecutor.Fsm.Transition.Execute(Message msg)
在 Microsoft.Internal.EnterpriseStorage.Dls.TaskExecutor.Fsm.Engine.ChangeState(Message msg)
在 Microsoft.Internal.EnterpriseStorage.Dls.TaskExecutor.TaskInstance.Process(Object dummy)
在 Microsoft.Internal.EnterpriseStorage.Dls.TaskExecutor.FsmThreadFunction.Function(Object obj)
在 System.Threading._ThreadPoolWaitCallback.WaitCallback_Context(Object state)
在 System.Threading.ExecutionContext.Run(ExecutionContext executionContext, ContextCallback callback, Object state)
在 System.Threading._ThreadPoolWaitCallback.PerformWaitCallbackInternal(_ThreadPoolWaitCallback tpWaitCallBack)
在 System.Threading._ThreadPoolWaitCallback.PerformWaitCallback(Object state)
我们查阅了DPM的源代码,我们认为系统在安装agent过程中调用了System.Management.ManagementObject.InvokeMethod方法并抛出异常,原因可能是安装agent使用的账户没有适当的权限连接客户端WMI。最后我们在live meeting中尝试连接出问题客户端的WMI也同样报错。我们猜测DPM Server在连接WMI时如果出错,会发生异常,导致DPM Service异常退出。
下一步工作
==========
对于上述分析,我们会采取以下方法定位问题,并尝试解决。
1、我们会在我们的测试环境中搭建DPM Server和客户端,关闭客户端WMI连接权限并尝试安装agent。重现问题的发生。
2、确定这个错误是否是由于DPM Server设计的问题而导致,如果确定,我们会反馈给相关部门,由相关部门处理并给出hotfix。
如果有任何问题,可以随时和我联系。