面对越来越多的单细胞数据被上传至NCBI上,单细胞数据挖掘分析也逐渐走入大家的眼中。如何寻找一个合适的单细胞数据用于后续非常重要,这时候大家可能会经常遇到这么一个问题,一个标准的10x的数据,为什么我怎么也读取不进去呢?,这里我们以GSE163974数据为例。

首先,进入NCBI,下载该数据集https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi

rarchiver下载 rar extractor lite_读取数据


下载之后解压

rarchiver下载 rar extractor lite_r语言_02

一个

一个样本一个文件夹,如GSM4994385样本

rarchiver下载 rar extractor lite_rarchiver下载_03


修改文件名

rarchiver下载 rar extractor lite_r语言_04


这时候,打开Rstudio

#修改工作路径
setwd('C:\\Users\\aa\\Desktop\\10X')
options(stringsAsFactors = F)
#加载R包
library(Seurat)
library(dplyr)
library(ggplot2)
library(magrittr)
library(gtools)
library(stringr)
library(Matrix)
library(tidyverse)
library(patchwork)
library(data.table)
library(RColorBrewer)
library(ggpubr)
#读取数据,批量读取数据
dir_name=c('GSM4994385','GSM4994386')
datalist=list()
for (i in 1:length(dir_name)){
  dir.10x = paste0("GSE163974_RAW/",dir_name[i])
  my.data <- Read10X(data.dir = dir.10x) 
  datalist[[i]]=CreateSeuratObject(counts = my.data, project = dir_name[i], 
                                   min.cells = 3, min.features = 250)
}

rarchiver下载 rar extractor lite_数据挖掘_05


这时候出现这样的报错,我们怎么处理呢?

这句话其实是告诉我们,我们的数据是有问题?

1、先解压表达谱,然后打开表达谱

rarchiver下载 rar extractor lite_数据_06


修改成

rarchiver下载 rar extractor lite_数据挖掘_07


使用7-zip反压回去

rarchiver下载 rar extractor lite_r语言_08


rarchiver下载 rar extractor lite_数据_09


2、打开features文件,接着修改

rarchiver下载 rar extractor lite_读取数据_10


添加一列

rarchiver下载 rar extractor lite_数据挖掘_11


再反压回去,这时候在进行测试,只要报错就要修改,有的会提示你,barcodes最后一行无法识别,那就解压该文件直接打开删掉最后一行的空行。

rarchiver下载 rar extractor lite_读取数据_12


#####################################################################

10x的数据相对来说还是比较规范的,如果遇到读不进去的时候,首先需要查看之前做过的10X的项目能不能读取进去,目的在于查看是否是环境不对导致的。

如果之前的可以,只有这套读取不见去,基本上可以认为是该数据有一定的问题,可以在进行修改,比对之前的文件,重新进行修正。

不同的R包版本,对于同一套数据可能是不一定的,可能在这套数据可以读取,下一套就不行的,这是因为不同版本的R对于10x数据格式要求的严格程度不同导致!

############新增,推荐一个在线分析的单细胞工具######

单细胞工具:http://www.sxdyc.com/singleCellTool

rarchiver下载 rar extractor lite_读取数据_13