这样做的目的是可以方便后期压缩模型
其实也可以用在其他的网络上只要你把其他的网络拆开就好
因为拆开和一起是一样的 至少从矩阵乘法上看确实如此

import torchimport numpy as npimport matplotlib.pyplot as pltimport torch.nn as nnfrom torch.autograd import Variable

x_tensor = torch.linspace(0, 6 * np