总结一句就是我真的太菜了。
想在自己的电脑上跑一下这个数据集,结果遇到很多问题,俺真是太菜了。。。。
先贴这个项目的三个链接。
1.论文
https://arxiv.org/abs/2010.14925 2.项目
https://medmnist.github.io/
3.github
https://github.com/MedMNIST/MedMNIST

在github上把整个代码下载下来,pycharm打开,嗯就是这个样子

amesim没有的模块库_github


下载下来直接右键运行train.py,很神奇这个默认是在pytest下运行的,报错报错,在run中改成一般的运行。再次运行,结果,说我没有sklearn。神奇

因为运行这个要用到pytorch,所以我一开始在settings中选择了这个

amesim没有的模块库_服务器_02


但是这里没有sklearn啊!!!好吧那就装一个,打开anaconda中的prompt,进入我当时装pytorch的虚拟环境:conda activate pytorch,然后pip install sklearn

amesim没有的模块库_amesim没有的模块库_03


完事,顺手把pandas也装了。

OK继续,发现environ.py 文件需要填两个路径,dataroot和outputroot,他有给参考是/data和/result,既然给了参考值,那就参考呗。

再次运行,还是报错,提示是:

Traceback (most recent call last):
 File “F:/pycharmProjects/MedMNIST-main/train.py”, line 225, in 
 data_name = sys.argv[1]
 IndexError: list index out of range

amesim没有的模块库_github_04


百度了一下这个错误,大意就是我少了一个参数,完整的是python xxx.py A,我少了A这个参数,正常的运行不是到文件名结束就完事了吗5555,这个A是啥,不管先传个5进去,诶这个pycharm下面的框框文字不能编辑诶,好吧那就用anaconda prompt运行,打开之后输入:

amesim没有的模块库_pytorch_05


又报错==,
 Traceback (most recent call last):
 File “F:/pycharmProjects/MedMNIST-main/train.py”, line 226, in 
 main(data_name)
 File “F:/pycharmProjects/MedMNIST-main/train.py”, line 36, in main
 with open(INFO, ‘r’) as f:
 FileNotFoundError: [Errno 2] No such file or directory: ‘./medmnist/medmnist.json’

OK那研究一下代码吧,应该是这个data_name不对,导致INFO读不出来,看了一下medmnist.json,上面那个神奇的A参数传的应该是10个不同的分类的名称,这就是这10个名字,那再来吧

amesim没有的模块库_amesim没有的模块库_06


选了chestmnist,还是报错啊啊啊啊我的心态,提示是:Traceback (most recent call last):

File “F:/pycharmProjects/MedMNIST-main/train.py”, line 226, in 
 main(data_name)
 File “F:/pycharmProjects/MedMNIST-main/train.py”, line 67, in main
 train_dataset = dataclass[flag](split=‘train’, transform=train_transform)
 File “F:\pycharmProjects\MedMNIST-main\medmnist\dataset.py”, line 23, in init
 npz_file = np.load(os.path.join(environ.dataroot,"{}.npz".format(self.flag)))
 File “C:\Anaconda3\envs\pytorch\lib\site-packages\numpy\lib\npyio.py”, line 428, in load
 fid = open(os_fspath(file), “rb”)
 FileNotFoundError: [Errno 2] No such file or directory: ‘/data\chestmnist.npz’

amesim没有的模块库_pytorch_07


到这一步发现,我根本没有下载数据集。。。。。。。。。。。===

https://www.dropbox.com/sh/upxrsyb5v8jxbso/AADOV0_6pC9Tb3cIACro1uUPa?dl=0 去这个链接把所有数据集都下载了,然后放在就是上面那个/data的data文件夹下,

amesim没有的模块库_服务器_08


再次运行!这次应该没问题了,开始漫长的等待。。。

amesim没有的模块库_github_09


以上都是在自己的拉闸笔记本上搞的,在服务器上搞搞更快,注意路径,我又去看了github他的原话,唉,一开始没仔细看,又是一大圈,

amesim没有的模块库_github_10


他这里说的好清楚哦。。。。

amesim没有的模块库_服务器_11


跑成功之后是这样子的,在result下有产生了这些文件

amesim没有的模块库_github_12


这是我第一个在服务器上跑的pytorch5555555555555