欢迎关注”生信修炼手册”!
1. KEGG数据库
KEGG Orthology 数据库简介KEGG Brite 数据库KEGG Module 数据库KEGG COMPOUND 数据库KEGG Enzyme 数据库KEGG Reaction 数据库KEGG Disease 数据库KEGG Network 数据库KEGG Drug 数据库KEGG Genome 数据库KEGG Genes 数据库KEGG Glycan 数据库KEGG pathway 数据库KEGG API 用法详解上篇KEGG API 用法详解下篇color pathway 使用指南 : 在通路图中标记基因KGML 文件: pathway 信息更加直观的存储方式KEGGgraph : 根据kgml 文件从pathway中重构出基因互作网络wikipathway : 代谢通路专用数据库PathVisio : wiki pathway 通路图可视化工具
2. DNA甲基化芯片
初识DNA甲基化芯片DNA 甲基化芯片中的bead到底是什么beta 值和 M 值: 衡量样本甲基化水平的金标准DNA甲基化芯片探针的P值如何计算甲基化芯片注释中的CpG shores, open sea 是什么illumina 官方提供的甲基化芯片分析软件 GenomeStudio - 安装篇GenomeStudio methylation : 对DNA甲基化水平进行定量GenomeStudio 中的背景校正和归一化算法使用GenomeStudio 鉴定差异甲基化位点minfi 分析甲基化芯片数据-数据导入篇minfi 分析甲基化芯片数据 - 质量过滤篇minfi 分析甲基化芯片数据 - 预处理篇minfi 分析甲基化芯片数据-差异分析篇minfi 分析甲基化芯片数据-pipeline篇(附完整代码)ChAMP R包安装中的事故ChAMP 分析甲基化芯片数据-数据导入篇ChAMP分析甲基化芯片数据-QC篇ChAMP 分析甲基化芯片数据-归一化篇ChAMP分析甲基化芯片数据-差异分析上篇ChAMP 分析甲基化芯片数据-差异分析下篇ChAMP分析甲基化芯片数据-GSEA篇ChAMP 分析甲基化芯片数据-EpiMod篇
3. 甲基化测序
bismark对参考基因组建立索引bismark 识别甲基化位点-比对篇bismark 识别甲基化位点bismark 识别甲基化位点-可视化篇methylKit 进行差异甲基化分析bsseq 进行差异甲基化分析
4. DNA甲基化数据库
DiseaseMeth 人类疾病相关的甲基化信息数据库PubMeth: 癌症相关的甲基化基因数据库iMETHYL : 整合了DNA甲基化, SNP和RNA_seq的多组学联合数据库MethHC: 整合了癌症相关的甲基化与基因表达谱数据的数据库MethyCancer : 癌症相关的甲基化基因数据库
5. circos软件
Circos 软件的安装详解circos 配置文件解析circos 可视化手册-ideogram 篇circos 可视化手册-ticks 篇circos 可视化手册-highlights 篇circos 可视化手册-links 篇circos 可视化手册-plots篇circos 可视化手册-scatter plot 篇circos 可视化手册-line plot 篇circos 可视化手册-histograms篇circos 可视化手册-tile 篇circos 可视化手册- heatmap 篇circos 可视化手册- text 篇circos 可视化手册-connector 篇circos tableviewer 展示表格数据circos 中堆积柱状图的画法circos 中的pattern是做什么用的circos 可视化手册- zooms 篇circos绘制彩色的linkscircos 可视化手册- images 篇circos 可视化手册- fonts 篇circos 可视化手册- colors 篇circos染色体进阶技巧circos 可视化手册- rules 篇
6. WES/WGS分析
外显子测序简介GATK4基本概念整理GATK官方推荐的workflow语言-WDLGATK4最佳实践-数据预处理篇GATK推荐的序列存储格式-uBAMbwa 软件用法简介MarkDuplicates 的意义与作用GATK BQSR的意义与作用GATK4 最佳实践-生殖细胞突变的检测与识别GATK4最佳实践-体细胞突变的检测与识别freebayes进行SNP callingVCF格式介绍tabix操作VCF文件dbSNP数据库简介HGVS制订的变异位点命名规则HapMap-人类基因组单倍型图谱1000 Genome ProjectgnomAD 数据库简介ESP数据库简介OMIM数据库简介clinvar数据库简介HGMD数据库简介COSMIC数据库简介CADD数据库简介SIFT score 预测基因突变对蛋白质功能的影响PolyPhen:分析人类非同义突变对蛋白质的影响DANN:利用神经网络算法评估变异位点的有害程度通过Eigen score衡量变异位点的功能重要性ANNOVAR变异位点注释软件ANNOVAR gene-based annotationANNOVAR region-based annotation-上篇ANNOVAR region-based annotation-下篇ANNOVAR Filter-based AnnotationsnpEff : 突变位点注释的又一利器使用SnpSift filter对VCF文件进行筛选SnpSift学习笔记(一)SnpSift学习笔记(二)SnpSift学习笔记(三)连锁不平衡:linkage disequilibriumplink PED 文件格式介绍使用plink进行连锁不平衡分析采用plink挑选tagSNPs使用plink进行case/control关联分析IBS在遗传分析中的运用Hardy–Weinberg equilibriumMendel errors对家系分型数据进行过滤基于家系数据的GWAS分析haploview进行连锁不平衡分析haploview绘制曼哈顿图bcftools安装简介bcftools学习笔记(一)bcftools学习笔记(二)bcftools进行SNP callingbcftools csq分析基因突变对蛋白水平的影响Control-Freec:检测拷贝数变异的神器LOH杂合性缺失简介ABSOLUTE评估肿瘤纯度Varscan检测de novo mutationbreakdancer检测结构变异
7. HLA分型
人类白细胞抗原-HLA简介IMGT/HLA数据库简介HLA Dictionary-Allel和抗原之间的对应关系ANFD-HLA在不同人群中的频率数据库HLA Epitope Registry-HLA抗原表位数据库HLAreporter : HLA分型软件简介HLAminer:根据NGS数据确定HLA分型结果opitype:对HLA I型基因进行4位分型seq2HLA:利用RNA_seq数据进行HLA分型HLA-VBSeq:对全基因组数据进行HLA分型使用HLAscan进行HLA分型HLAforest:使用RNA-seq数据进行HLA分型
8. 基因组组装
基因组组装中的kmer究竟是何方神圣jellyfish:快速计算kmer分布Gerbil:支持GPU加速的kmer count工具GenomeScope评估基因组大小和杂合度SSRIT:简单重复序列识别工具Tandem Repeats Finder:串联重复序列查找工具Dfam:真核生物转座元件数据库RepeatMasker:查找基因组上的重复序列soapdenovo2进行基因组组装velvet软件进行基因组组装Abyss:基于布隆过滤器的基因组组装软件ALLPATHS-LG基因组组装软件简介spades基因组组装软件简介QUAST:评估基因组组装效果GAGE:基因组组装评估的金标准Augustus:真核生物基因结构预测软件-安装篇GeneMark-ES:真核生物编码基因预测软件Glimmer:识别微生物中的蛋白编码基因tRNAscan-SE:预测基因组上的tRNA基因RNAmmer:预测基因组上的核糖体RNAbarrnap:预测基因组上的核糖体RNAGtRNAdb:tRNA数据库简介tRNAdb:综合序列和二级结构的tRNA数据库Gene Ontology-基因产物功能数据库AmiGO2:在线浏览和查询GO信息的利器quickGO:在线查询GO和GO注释信息的网站GOA:Gene Ontology注释信息数据库Pfam:蛋白质家族数据库简介COG:直系同源蛋白数据库eggNOG:从COG延伸出来的同源蛋白数据库SMART:蛋白质结构域数据库Euk-mPLOC:预测真核生物蛋白的亚细胞定位
9. 多序列比对与进化树
使用Clustal进行多序列比对使用muscle进行多序列比对使用mafft进行多序列比对kalign:适用于基因组规模的多序列比对工具phyml:基于最大似然法构建进化树FastTree:速度最快的最大似然法进化树构建软件Newick: tree文件格式简介
10. 高通量测序质控
cutadapt去除adapter序列使用fastp对NGS数据进行质量过滤使用Trimmomatic对NGS数据进行质量过滤使用trim_galore对NGS数据进行质量过滤FastQC评估测序数据的质量fastx_toolkit:处理fasta/fastq文件的小工具
11. 转录组基础分析
详解参考基因组的下载方式详解人类基因在不同数据库中的IDGFF文件格式简介GTF文件格式简介从UCSC下载基因组的GTF文件详解GFF转换为GTF文件gencode-高质量的基因注释信息数据库hisat2:比对基因组工具简介STAR:转录组数据比对工具简介SAM/BAM文件格式简介(一)SAM/BAM文件格式简介(二)stringTie:转录本组装和定量工具sailfish:不需要比对的转录本定量软件salmon:sailfish的升级版本kallisto:alignment-free转录本定量工具使用htseq-count进行定量分析使用featureCounts进行定量分析DESeq2归一化算法详解采用DESeq2对表达量进行PCA和聚类分析使用DESeq2进行两组间的差异分析edgeR提供的TMM归一化算法详解使用edgeR进行两组间的差异分析负二项分布在差异分析中的应用详解CPM定量方式使用ballgown进行转录本水平的差异分析sleuth:基于TPM值的差异分析使用limma进行两组间的差异分析揭秘差异基因功能富集分析GO.db:存储Gene Ontology信息的R包详解如何获取物种所有基因对应的GO注释详解GO的层级关系在富集分析中的应用使用topGO进行GO富集分析使用clusterProfiler进行GO富集分析使用clusterProfiler进行KEGG富集分析转录组中的基因表达模式聚类分析使用Mfuzz进行时间序列表达模式聚类分析使用maSigPro进行时间序列数据的差异分析
12. GSEA
MSigDB:GSEA提供的基因集数据库GSEA软件使用方法简介GSEA分析结果详细解读关于GSEA的几点补充说明
13. WGCNA
加权基因共表达网络,其实并没有那么神秘WGCNA如何挖掘潜在的共表达基因WGCNA将共表达基因与表型数据相关联WGCNA如何从module中挖掘关键基因WGCNA实战练习
14. PPI
STRING:蛋白质相互作用(PPI网络)数据库简介MINT:蛋白质相互作用数据库简介IMex和IntAct数据库简介HPRD:human专属的PPI数据库BioGRID:蛋白质相互作用数据库如何从PPI网络进一步挖掘信息PPI网络实战:String加Cytoscape联手挖掘PPI网络采用igraph包分析网络数据使用Cytoscape的NetworkAnalyzer工具计算网络相关属性通过NetworkAnalyst在线服务构建PPI网络
15. 融合基因
揭秘转录组分析中的融合基因鉴定使用SOAPfuse进行融合基因的分析使用FusionMap检测融合基因使用tophat-fusion鉴定融合基因使用STAR-fusion进行融合基因的分析使用EricScript进行融合基因的分析使用fusioncatcher进行融合基因的分析融合基因数据库大全
16. 可变剪切
可变剪切的意义和重要性揭秘可变剪切研究的本质使用rmats进行可变剪切的分析使用MISO进行可变剪切的分析rmats2sashimiplot:可视化rmats的可变剪切结果
17. 转录因子调控网络
TRANSFAC:转录因子及其靶基因数据库JASPAR:转录因子motif数据库TFTG:human转录因子靶基因数据库ENCODE转录因子靶基因数据库TRRUST:人和小鼠的转录因子调控网络数据库footprintDB:综合性的转录因子数据库chipBase:转录调控数据库转录因子的靶基因,看这一个数据库就够了
18. RNA编辑
RNA编辑简介RADAR:RNA编辑位点的数据库DARNED:RNA编辑位点数据库REDIportal:最大的人类RNA编辑位点数据库
19. microRNA
microRNA简介miRNA命名规范mirbase数据库简介Rfam数据库简介RNAcentral:非编码RNA数据库miRTarBase:实验验证的miRNA靶基因数据库mirDIP:最全面的人类miRNA靶基因数据库miRWalk:综合型的miRNA靶基因数据库miRcode:人类miRNA结合图谱数据库TargetScan:哺乳动物miRNA靶基因数据库miRanda和mirSVR:预测miRNA结合位点的工具miRDB:软件预测的哺乳动物miRNA靶基因数据库TarBase:有实验数据支持的miRNA靶基因数据库HMDD:miRNA相关疾病数据库miRCancer:肿瘤相关的miRNA表达谱数据库mir2disease:miRNA相关疾病数据库TransmiR:转录因子和miRNA调控关系数据库miRPath:miRNA相关GO和KEGG功能分析MirSNP:miRNA相关SNP位点数据库RNA二级结构表示法:Dot-Bracket notation已知miRNA定量原理揭秘RNAfold预测RNA的二级结构mirdeep2识别novel miRNAGEO数据库架构介绍GEO数据库中platform信息详解GEO2R:对GEO数据库中的数据进行差异分析
20. 单细胞转录组
scRNA_seq:单细胞转录组测序简介使用cell ranger拆分10X单细胞转录组原始数据使用cell ranger进行单细胞转录组定量分析cell ranger分析结果详细解读使用Loupe Cell Browser查看10X单细胞转录组分析结果Seurat:用于分析10X单细胞转录组数据的R包使用scater包对单细胞转录组数据进行降维分析使用Rtsne包进行t-SNE降维分析单细胞转录组中的pseudotime究竟是什么使用monocle包进行pseudotime分析
21. lncRNA
NONCODE:综合性的lncRNA数据库LNCipedia:人类lncRNA数据库LncBook:综合性的人类lncRNA数据库lncRNome:综合性的人类lncRNA数据库PlncRNADB:植物lncRNA数据库CANTATAdb:植物lncRNA数据库GreeNC:植物lncRNA数据库EVLncRNAs:最大的实验验证过的lncRNA数据库LncRNA2Target:lncRNA靶基因数据库Co-LncRNA:lncRNA与蛋白编码基因的共表达网络数据库LncBase:lncRNA与miRNA相互作用数据库
LncMAP:lncRNA-TF-gene调控网络数据库MNDR:哺乳动物中与疾病相关的ncRNA数据库NSDNA:神经系统疾病相关的ncRNA数据库lncrnadisease:lncRNA相关疾病数据库lnc2Cancer:lncRNA相关肿瘤数据库Lnc2Catlas:肿瘤相关的lncRNA数据库LincSNP:lncRNA相关SNP位点数据库lncRNASNP:SNP位点对lncNA结构和lncRNA-miRNA影响的数据库Lnc2Meth:与疾病相关的lncRNA上的甲基化位点LncACTdb:lncRNA相关的ceRNA网络数据库LncCeRbase:人类lncRNA相关ceRNA数据库CPAT:转录本蛋白编码能力预测软件CPC:转录本蛋白编码潜能预测工具CNCI:转录本蛋白编码潜能预测工具PLEK:转录本蛋白编码潜能预测工具LGC:转录本蛋白编码潜能预测工具
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!