1、 hadoop远程debug
从文档(3)中可以知道hadoop启动服务的时候最终都是通过java命令来启动的,其本质是一个java程序。在研究源码的时候debug是一种很重要的工具,但是hadoop是编译好了的代码,直接在liunx中运行的,无法象普通的程序一样可以直接在eclipse之类的工具中直接debug运行。
对于上述情况java提供了一种远程debug的方式。这种方式需要在java程序启动的时候添加以下参数:
-agentlib:jdwp=transport=dt_socket,server=y,address=6603,suspend=y
其中transport是指定双方的数据传输方式,server表示是否监听debuger的调试请求,address是监听端口,suspend是表示是否等待启动。
所以为了能远程debug hadoop,需要修改hadoop的启动脚本。推荐修改bin目录下的hdfs文件进行修改,修改方式如下图:
如上图所示,被注释掉的语句是包含远程调试的参数,未被注释的是其正常的启动参数。在这里修改还有一个好处是可以针对指定的服务进行远程debug设置。上图是针对namenode进行远程debug设置。若要对其他的服务进行远程debug,那么只需修改对应节点的hdfs文件中与该服务名称对应的参数便可。
修改完成后,使用sbin目录下的脚本启动便可。
启动成功后,便可以使用eclipse等工具进行远程调试。下面以eclipse为例:![在这里插入图片描述](
首先在eclipse的代码框中点击右键,在弹出的选项框中选择debug as,在其弹出的选项框中选择debug configurations。打开debug的配置页面,如下图:
然后双击remote java application(或者点击右键,然后选择new configuration),界面如下:
其中,name可以自定义,host需要写启动远程debug服务器的地址,prot需要写上述参数中的端口。若无误便可点击下方的debug按钮,开始debug。