欢迎关注”生信修炼手册”!

1. KEGG数据库

​KEGG Orthology 数据库简介​​​​KEGG Brite 数据库​​​​KEGG Module 数据库​​​​KEGG COMPOUND 数据库​​​​KEGG Enzyme 数据库​​​​KEGG Reaction 数据库​​​​KEGG Disease 数据库​​​​KEGG Network 数据库​​​​KEGG Drug 数据库​​​​KEGG Genome 数据库​​​​KEGG Genes 数据库​​​​KEGG Glycan 数据库​​​​KEGG pathway 数据库​​​​KEGG API 用法详解上篇​​​​KEGG API 用法详解下篇​​​​color pathway 使用指南 : 在通路图中标记基因​​​​KGML 文件: pathway 信息更加直观的存储方式​​​​KEGGgraph : 根据kgml 文件从pathway中重构出基因互作网络​​​​wikipathway : 代谢通路专用数据库​​​​PathVisio : wiki pathway 通路图可视化工具​

2. DNA甲基化芯片

​初识DNA甲基化芯片​​​​DNA 甲基化芯片中的bead到底是什么​​​​beta 值和 M 值: 衡量样本甲基化水平的金标准​​​​DNA甲基化芯片探针的P值如何计算​​​​甲基化芯片注释中的CpG shores, open sea 是什么​​​​illumina 官方提供的甲基化芯片分析软件 GenomeStudio - 安装篇​​​​GenomeStudio methylation : 对DNA甲基化水平进行定量​​​​GenomeStudio 中的背景校正和归一化算法​​​​使用GenomeStudio 鉴定差异甲基化位点​​​​minfi 分析甲基化芯片数据-数据导入篇​​​​minfi 分析甲基化芯片数据 - 质量过滤篇​​​​minfi 分析甲基化芯片数据 - 预处理篇​​​​minfi 分析甲基化芯片数据-差异分析篇​​​​minfi 分析甲基化芯片数据-pipeline篇(附完整代码)​​​​ChAMP R包安装中的事故​​​​ChAMP 分析甲基化芯片数据-数据导入篇​​​​ChAMP分析甲基化芯片数据-QC篇​​​​ChAMP 分析甲基化芯片数据-归一化篇​​​​ChAMP分析甲基化芯片数据-差异分析上篇​​​​ChAMP 分析甲基化芯片数据-差异分析下篇​​​​ChAMP分析甲基化芯片数据-GSEA篇​​​​ChAMP 分析甲基化芯片数据-EpiMod篇​

3. 甲基化测序

​bismark对参考基因组建立索引​​​​bismark 识别甲基化位点-比对篇​​​​bismark 识别甲基化位点​​​​bismark 识别甲基化位点-可视化篇​​​​methylKit 进行差异甲基化分析​​​​bsseq 进行差异甲基化分析​

4. DNA甲基化数据库

​DiseaseMeth 人类疾病相关的甲基化信息数据库​​​​PubMeth: 癌症相关的甲基化基因数据库​​​​iMETHYL : 整合了DNA甲基化, SNP和RNA_seq的多组学联合数据库​​​​MethHC: 整合了癌症相关的甲基化与基因表达谱数据的数据库​​​​MethyCancer : 癌症相关的甲基化基因数据库​

5. circos软件

​Circos 软件的安装详解​​​​circos 配置文件解析​​​​circos 可视化手册-ideogram 篇​​​​circos 可视化手册-ticks 篇​​​​circos 可视化手册-highlights 篇​​​​circos 可视化手册-links 篇​​​​circos 可视化手册-plots篇​​​​circos 可视化手册-scatter plot 篇​​​​circos 可视化手册-line plot 篇​​​​circos 可视化手册-histograms篇​​​​circos 可视化手册-tile 篇​​​​circos 可视化手册- heatmap 篇​​​​circos 可视化手册- text 篇​​​​circos 可视化手册-connector 篇​​​​circos tableviewer 展示表格数据​​​​circos 中堆积柱状图的画法​​​​circos 中的pattern是做什么用的​​​​circos 可视化手册- zooms 篇​​​​circos绘制彩色的links​​​​circos 可视化手册- images 篇​​​​circos 可视化手册- fonts 篇​​​​circos 可视化手册- colors 篇​​​​circos染色体进阶技巧​​​​circos 可视化手册- rules 篇​

6. WES/WGS分析

​外显子测序简介​​​​GATK4基本概念整理​​​​GATK官方推荐的workflow语言-WDL​​​​GATK4最佳实践-数据预处理篇​​​​GATK推荐的序列存储格式-uBAM​​​​bwa 软件用法简介​​​​MarkDuplicates 的意义与作用​​​​GATK BQSR的意义与作用​​​​GATK4 最佳实践-生殖细胞突变的检测与识别​​​​GATK4最佳实践-体细胞突变的检测与识别​​​​freebayes进行SNP calling​​​​VCF格式介绍​​​​tabix操作VCF文件​​​​dbSNP数据库简介​​​​HGVS制订的变异位点命名规则​​​​HapMap-人类基因组单倍型图谱​​​​1000 Genome Project​​​​gnomAD 数据库简介​​​​ESP数据库简介​​​​OMIM数据库简介​​​​clinvar数据库简介​​​​HGMD数据库简介​​​​COSMIC数据库简介​​​​CADD数据库简介​​​​SIFT score 预测基因突变对蛋白质功能的影响​​​​PolyPhen:分析人类非同义突变对蛋白质的影响​​​​DANN:利用神经网络算法评估变异位点的有害程度​​​​通过Eigen score衡量变异位点的功能重要性​​​​ANNOVAR变异位点注释软件​​​​ANNOVAR gene-based annotation​​​​ANNOVAR region-based annotation-上篇​​​​ANNOVAR region-based annotation-下篇​​​​ANNOVAR Filter-based Annotation​​​​snpEff : 突变位点注释的又一利器​​​​使用SnpSift filter对VCF文件进行筛选​​​​SnpSift学习笔记(一)​​​​SnpSift学习笔记(二)​​​​SnpSift学习笔记(三)​​​​连锁不平衡:linkage disequilibrium​​​​plink PED 文件格式介绍​​​​使用plink进行连锁不平衡分析​​​​采用plink挑选tagSNPs​​​​使用plink进行case/control关联分析​​​​IBS在遗传分析中的运用​​​​Hardy–Weinberg equilibrium​​​​Mendel errors对家系分型数据进行过滤​​​​基于家系数据的GWAS分析​​​​haploview进行连锁不平衡分析​​​​haploview绘制曼哈顿图​​​​bcftools安装简介​​​​bcftools学习笔记(一)​​​​bcftools学习笔记(二)​​​​bcftools进行SNP calling​​​​bcftools csq分析基因突变对蛋白水平的影响​​​​Control-Freec:检测拷贝数变异的神器​​​​LOH杂合性缺失简介​​​​ABSOLUTE评估肿瘤纯度​​​​Varscan检测de novo mutation​​​​breakdancer检测结构变异​

7. HLA分型

​人类白细胞抗原-HLA简介​​​​IMGT/HLA数据库简介​​​​HLA Dictionary-Allel和抗原之间的对应关系​​​​ANFD-HLA在不同人群中的频率数据库​​​​HLA Epitope Registry-HLA抗原表位数据库​​​​HLAreporter : HLA分型软件简介​​​​HLAminer:根据NGS数据确定HLA分型结果​​​​opitype:对HLA I型基因进行4位分型​​​​seq2HLA:利用RNA_seq数据进行HLA分型​​​​HLA-VBSeq:对全基因组数据进行HLA分型​​​​使用HLAscan进行HLA分型​​​​HLAforest:使用RNA-seq数据进行HLA分型​

8. 基因组组装

​基因组组装中的kmer究竟是何方神圣​​​​jellyfish:快速计算kmer分布​​​​Gerbil:支持GPU加速的kmer count工具​​​​GenomeScope评估基因组大小和杂合度​​​​SSRIT:简单重复序列识别工具​​​​Tandem Repeats Finder:串联重复序列查找工具​​​​Dfam:真核生物转座元件数据库​​​​RepeatMasker:查找基因组上的重复序列​​​​soapdenovo2进行基因组组装​​​​velvet软件进行基因组组装​​​​Abyss:基于布隆过滤器的基因组组装软件​​​​ALLPATHS-LG基因组组装软件简介​​​​spades基因组组装软件简介​​​​QUAST:评估基因组组装效果​​​​GAGE:基因组组装评估的金标准​​​​Augustus:真核生物基因结构预测软件-安装篇​​​​GeneMark-ES:真核生物编码基因预测软件​​​​Glimmer:识别微生物中的蛋白编码基因​​​​tRNAscan-SE:预测基因组上的tRNA基因​​​​RNAmmer:预测基因组上的核糖体RNA​​​​barrnap:预测基因组上的核糖体RNA​​​​GtRNAdb:tRNA数据库简介​​​​tRNAdb:综合序列和二级结构的tRNA数据库​​​​Gene Ontology-基因产物功能数据库​​​​AmiGO2:在线浏览和查询GO信息的利器​​​​quickGO:在线查询GO和GO注释信息的网站​​​​GOA:Gene Ontology注释信息数据库​​​​Pfam:蛋白质家族数据库简介​​​​COG:直系同源蛋白数据库​​​​eggNOG:从COG延伸出来的同源蛋白数据库​​​​SMART:蛋白质结构域数据库​​​​Euk-mPLOC:预测真核生物蛋白的亚细胞定位​

9. 多序列比对与进化树

​使用Clustal进行多序列比对​​​​使用muscle进行多序列比对​​​​使用mafft进行多序列比对​​​​kalign:适用于基因组规模的多序列比对工具​​​​phyml:基于最大似然法构建进化树​​​​FastTree:速度最快的最大似然法进化树构建软件​​​​Newick: tree文件格式简介​

10. 高通量测序质控

​cutadapt去除adapter序列​​​​使用fastp对NGS数据进行质量过滤​​​​使用Trimmomatic对NGS数据进行质量过滤​​​​使用trim_galore对NGS数据进行质量过滤​​​​FastQC评估测序数据的质量​​​​fastx_toolkit:处理fasta/fastq文件的小工具​

11. 转录组基础分析

​详解参考基因组的下载方式​​​​详解人类基因在不同数据库中的ID​​​​GFF文件格式简介​​​​GTF文件格式简介​​​​从UCSC下载基因组的GTF文件​​​​详解GFF转换为GTF文件​​​​gencode-高质量的基因注释信息数据库​​​​hisat2:比对基因组工具简介​​​​STAR:转录组数据比对工具简介​​​​SAM/BAM文件格式简介(一)​​​​SAM/BAM文件格式简介(二)​​​​stringTie:转录本组装和定量工具​​​​sailfish:不需要比对的转录本定量软件​​​​salmon:sailfish的升级版本​​​​kallisto:alignment-free转录本定量工具​​​​使用htseq-count进行定量分析​​​​使用featureCounts进行定量分析​​​​DESeq2归一化算法详解​​​​采用DESeq2对表达量进行PCA和聚类分析​​​​使用DESeq2进行两组间的差异分析​​​​edgeR提供的TMM归一化算法详解​​​​使用edgeR进行两组间的差异分析​​​​负二项分布在差异分析中的应用​​​​详解CPM定量方式​​​​使用ballgown进行转录本水平的差异分析​​​​sleuth:基于TPM值的差异分析​​​​使用limma进行两组间的差异分析​​​​揭秘差异基因功能富集分析​​​​GO.db:存储Gene Ontology信息的R包​​​​详解如何获取物种所有基因对应的GO注释​​​​详解GO的层级关系在富集分析中的应用​​​​使用topGO进行GO富集分析​​​​使用clusterProfiler进行GO富集分析​​​​使用clusterProfiler进行KEGG富集分析​​​​转录组中的基因表达模式聚类分析​​​​使用Mfuzz进行时间序列表达模式聚类分析​​​​使用maSigPro进行时间序列数据的差异分析​

12. GSEA

​MSigDB:GSEA提供的基因集数据库​​​​GSEA软件使用方法简介​​​​GSEA分析结果详细解读​​​​关于GSEA的几点补充说明​

13. WGCNA

​加权基因共表达网络,其实并没有那么神秘​​​​WGCNA如何挖掘潜在的共表达基因​​​​WGCNA将共表达基因与表型数据相关联​​​​WGCNA如何从module中挖掘关键基因​​​​WGCNA实战练习​

14. PPI

​STRING:蛋白质相互作用(PPI网络)数据库简介​​​​MINT:蛋白质相互作用数据库简介​​​​IMex和IntAct数据库简介​​​​HPRD:human专属的PPI数据库​​​​BioGRID:蛋白质相互作用数据库​​​​如何从PPI网络进一步挖掘信息​​​​PPI网络实战:String加Cytoscape联手挖掘PPI网络​​​​采用igraph包分析网络数据​​​​使用Cytoscape的NetworkAnalyzer工具计算网络相关属性​​​​通过NetworkAnalyst在线服务构建PPI网络​

15. 融合基因

​揭秘转录组分析中的融合基因鉴定​​​​使用SOAPfuse进行融合基因的分析​​​​使用FusionMap检测融合基因​​​​使用tophat-fusion鉴定融合基因​​​​使用STAR-fusion进行融合基因的分析​​​​使用EricScript进行融合基因的分析​​​​使用fusioncatcher进行融合基因的分析​​​​融合基因数据库大全​

16. 可变剪切

​可变剪切的意义和重要性​​​​揭秘可变剪切研究的本质​​​​使用rmats进行可变剪切的分析​​​​使用MISO进行可变剪切的分析​​​​rmats2sashimiplot:可视化rmats的可变剪切结果​

17. 转录因子调控网络

​TRANSFAC:转录因子及其靶基因数据库​​​​JASPAR:转录因子motif数据库​​​​TFTG:human转录因子靶基因数据库​​​​ENCODE转录因子靶基因数据库​​​​TRRUST:人和小鼠的转录因子调控网络数据库​​​​footprintDB:综合性的转录因子数据库​​​​chipBase:转录调控数据库​​​​转录因子的靶基因,看这一个数据库就够了​

18. RNA编辑

​RNA编辑简介​​​​RADAR:RNA编辑位点的数据库​​​​DARNED:RNA编辑位点数据库​​​​REDIportal:最大的人类RNA编辑位点数据库​

19. microRNA

​microRNA简介​​​​miRNA命名规范​​​​mirbase数据库简介​​​​Rfam数据库简介​​​​RNAcentral:非编码RNA数据库​​​​miRTarBase:实验验证的miRNA靶基因数据库​​​​mirDIP:最全面的人类miRNA靶基因数据库​​​​miRWalk:综合型的miRNA靶基因数据库​​​​miRcode:人类miRNA结合图谱数据库​​​​TargetScan:哺乳动物miRNA靶基因数据库​​​​miRanda和mirSVR:预测miRNA结合位点的工具​​​​miRDB:软件预测的哺乳动物miRNA靶基因数据库​​​​TarBase:有实验数据支持的miRNA靶基因数据库​​​​HMDD:miRNA相关疾病数据库​​​​miRCancer:肿瘤相关的miRNA表达谱数据库​​​​mir2disease:miRNA相关疾病数据库​​​​TransmiR:转录因子和miRNA调控关系数据库​​​​miRPath:miRNA相关GO和KEGG功能分析​​​​MirSNP:miRNA相关SNP位点数据库​​​​RNA二级结构表示法:Dot-Bracket notation​​​​已知miRNA定量原理揭秘​​​​RNAfold预测RNA的二级结构​​​​mirdeep2识别novel miRNA​​​​GEO数据库架构介绍​​​​GEO数据库中platform信息详解​​​​GEO2R:对GEO数据库中的数据进行差异分析​

20. 单细胞转录组

​scRNA_seq:单细胞转录组测序简介​​​​使用cell ranger拆分10X单细胞转录组原始数据​​​​使用cell ranger进行单细胞转录组定量分析​​​​cell ranger分析结果详细解读​​​​使用Loupe Cell Browser查看10X单细胞转录组分析结果​​​​Seurat:用于分析10X单细胞转录组数据的R包​​​​使用scater包对单细胞转录组数据进行降维分析​​​​使用Rtsne包进行t-SNE降维分析​​​​单细胞转录组中的pseudotime究竟是什么​​​​使用monocle包进行pseudotime分析​

21. lncRNA

​NONCODE:综合性的lncRNA数据库​​​​LNCipedia:人类lncRNA数据库​​​​LncBook:综合性的人类lncRNA数据库​​​​lncRNome:综合性的人类lncRNA数据库​​​​PlncRNADB:植物lncRNA数据库​​​​CANTATAdb:植物lncRNA数据库​​​​GreeNC:植物lncRNA数据库​​​​EVLncRNAs:最大的实验验证过的lncRNA数据库​​​​LncRNA2Target:lncRNA靶基因数据库​​​​Co-LncRNA:lncRNA与蛋白编码基因的共表达网络数据库​​LncBase:lncRNA与miRNA相互作用数据库
​LncMAP:lncRNA-TF-gene调控网络数据库​​​​MNDR:哺乳动物中与疾病相关的ncRNA数据库​​​​NSDNA:神经系统疾病相关的ncRNA数据库​​​​lncrnadisease:lncRNA相关疾病数据库​​​​lnc2Cancer:lncRNA相关肿瘤数据库​​​​Lnc2Catlas:肿瘤相关的lncRNA数据库​​​​LincSNP:lncRNA相关SNP位点数据库​​​​lncRNASNP:SNP位点对lncNA结构和lncRNA-miRNA影响的数据库​​​​Lnc2Meth:与疾病相关的lncRNA上的甲基化位点​​​​LncACTdb:lncRNA相关的ceRNA网络数据库​​​​LncCeRbase:人类lncRNA相关ceRNA数据库​​​​CPAT:转录本蛋白编码能力预测软件​​​​CPC:转录本蛋白编码潜能预测工具​​​​CNCI:转录本蛋白编码潜能预测工具​​​​PLEK:转录本蛋白编码潜能预测工具​​​​LGC:转录本蛋白编码潜能预测工具​


·end·

—如果喜欢,快分享给你的朋友们吧—


扫描关注微信号,更多精彩内容等着你!

2018年推文合集_数据库