背景

经济下行的大环境下,很多公司都在做出海业务,即把海外人民做为服务对象。我司亦不例外。最近在全职负责的一款数据产品,也需要在菲律宾(马尼拉)也部署一个站点。

站点部署成功,看起来一切顺利。既然是数据产品,少不了需要个数据源菜单,数据源管理列表页。

马尼拉业务的数仓owner是在阿里云申请MaxCompute数据源(后文简称MC),在DataWorks上可以正常使用。但在这个数据产品平台里,新增MC数据源,然后连通测试时,却报错504 Gateway Time-out:

连接阿里云MaxCompute数据源报错504 Gateway Time-out_数据源

奇奇怪怪,504 Gateway Time-out一般不是连接服务器超时失败。为啥通过JDBC(具体来说,是阿里提供的ODPS-JDBC)测试MC数据源,即ODPS数据源,却报错504?

<dependency>
<groupId>com.aliyun.odps</groupId>
<artifactId>odps-jdbc</artifactId>
<version>3.2.21</version>
</dependency>

通过断点调试代码:

连接阿里云MaxCompute数据源报错504 Gateway Time-out_odps_02


实际上,阿里云的MC(即ODPS)数据源的连接串的格式比较特殊:​​jdbc:odps:http://aaaa.bbbbb.maxcompute.aliyun-inc.com/api?project=ccccc​​。截取odps后面的字符串,就可以得到一个http地址,可以使用浏览器打开:

连接阿里云MaxCompute数据源报错504 Gateway Time-out_内网_03


经过沟通,得知MC数仓是部署在新加坡环境。浏览器打开数据源连接信息报错如下:

连接阿里云MaxCompute数据源报错504 Gateway Time-out_数据产品_04


经过排查,是公网和内网的区别。所谓的公网就是没有​​-inc​​​,内网是带​​-inc​​:

连接阿里云MaxCompute数据源报错504 Gateway Time-out_数据源_05


连接阿里云MaxCompute数据源报错504 Gateway Time-out_数据产品_06


走公网的话,涉及到数据敏感性和隐私保护等问题,不建议使用公网方式。

因此需要走内网,走内网是需要配置代理中转一下,或者使用vpc、nat等方式,配置比较麻烦。

至于为啥内网有这个504网关超时问题,是因为我负责的数据平台是部署在菲律宾(马尼拉)region,而MaxCompute数仓是部署在新加坡region,跨region,可理解为跨网段。

事后反思:连接数据源报错504,第一印象是一脸呆(meng)滞(bi),我是想要连接数据库呀,为啥和服务扯上关系。实际上MaxCompute可以理解为一个后端服务,从其JDBC连接串信息能看出个大概。