KEGG简介

KEGG是一个整合了基因组、化学和系统功能信息的数据库。把从已经完整测序的基因组中得到的基因目录与更高级别的细胞、物种和生态系统水平的系统功能关联起来是KEGG数据库的特色之一。与其他数据库相比,KEGG 的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系,这样可以使研究者能够对其关注的代谢途径有直观全面的了解。

ko:表示通路,这个通路是不分物种的,相当于所有物种某一通路的并集。

KO(KEGG Orthology):是KEGG中一个“专有名词”,表征一个基因。KO作为ko通路中的基本单位,它是蛋白质(酶)的一个分类体系。通常序列高度相似且在同一通路中具有相似功能的蛋白质被归为一组,即一个KO。

下面来聊聊小美感受到的KEGG百科特色吧~

“(*@ο@*) 哇~十几个子数据库、各种查询方法,最最重要的是有这么多的在线分析工具,简直太nice了!”这是小美第一次登陆KEGG的感受,瞬间路转粉的节奏啊。

但高兴不过10秒,“/(ㄒoㄒ)/~这么多东西,谁来告诉我该从哪下手啊!”

不用担心,经过老老实实的在KEGG里“点点点”后,小美也算摸索出了些门道,今天就对大家倾囊相授吧!

---------------此处应该有“歌”声-------------



01

这里KEGG的最优打开方式

打开网址 http://www.genome.jp/kegg/kegg2.html(复制这一串网址,粘贴到任意浏览器的地址栏中,敲击回车键即可,下同),首先映入眼帘的就是下面这个界面:

代谢组学分析流程R语言 代谢组学kegg_数据

KEGG - Table of Contents功能简介:

① 以分类列表的形式介绍了KEGG所包含各个内容模块,其中蓝色的字体可以直接点击进入以获取更为详细的各模块相关内容介绍;

② 拥有全局性检索框,在检索框内输入关键词,即可查询KEGG中与关键词相关的Pathway(通路)、Module (模块)、Orthology(直系同源)和Genome(基因组)、Genes(基因)和Enzyme(酶)等诸多信息;如有特殊需求,也可以进行个性化筛选,比如仅搜索与关键词相关的Module信息。



02

KEGG数据库如此繁杂,关系如何理

打开另一网址 http://www.genome.jp/linkdb/linkdb.html ,将看见这个界面:

代谢组学分析流程R语言 代谢组学kegg_数据_02

LinkDB: database of link information功能简介:

LinkDB解析了KEGG数据库内部数据的流通以及和其它数据库的联系。若是需要了解具体某个数据库(如 :Pathway)的来源,直接点击上图下方的Pathway即可高亮显示该数据库数据来源相关的各类数据库名称。此外,还可以直接下载数据库与数据库间的编号对应关系哦!



03

如何利用KEGG完成数据挖掘?

问题:我想做类似下面文献中的两张图?

代谢组学分析流程R语言 代谢组学kegg_系统功能_03

代谢组学分析流程R语言 代谢组学kegg_数据_04

解决:嗯...从上图来看的话,首要任务就是收集氮代谢(Nitrogen metabolism)相关的数据信息啊,那怎么搜呢?

完全不用担心,用KEGG分分钟就能get!

步骤如下(查找方式多种,此处我们以上面介绍的“KEGG最优打开方式”为例进行演示):

①最优方式打开KEGG数据库,Search栏直接输入“Nitrogen”再回车,将会检索到KEGG中与氮代谢相关的各类信息,其中KEGG PATHWAY下的map00910就是我们要查找的关键信息:

代谢组学分析流程R语言 代谢组学kegg_数据_05

代谢组学分析流程R语言 代谢组学kegg_系统功能_06

②点击上一步中的“map00910”,将出现如下图所展示的氮代谢相关内容的精细描述,此外下图右侧的“All links”栏还给出了诸如:有7个相关Module,2个疾病相关内容,还有我们需要get的60个氮相关基因KEGG ORTHOLOGY(KO)等索引信息。

代谢组学分析流程R语言 代谢组学kegg_数据库_07

③点开上图右侧“All links”中Gene类型中的KEGG Orthology (60),将出现如下图所示的60个参与氮代谢的KO号。

代谢组学分析流程R语言 代谢组学kegg_数据_08

④最后,从我们自己的KEGG注释结果中挑出相关的KO或Gene和Module等信息作为输入数据,就可以去分析作图了(比如上面的Heatmap、重构代谢通路图)。

高大上分析四步走完,有木有很简单!



04

其它KEGG在线工具如何使用?

使用最优方式打开KEGG数据库,可以发现KEGG数据库还提供多种其它在线分析工具:

代谢组学分析流程R语言 代谢组学kegg_数据库_09

代谢组学分析流程R语言 代谢组学kegg_代谢组学分析流程R语言_10

今天先给大家介绍上图中2种比较炫酷的工具,其它工具可根据个人需求自行学习哟!



KEGG Mapper - Search & Color Pathway工具

利用Search & Color Pathway在线工具可DIY通路图中的基因(KO)或其它信息(如文字)的背景填充色,具体操作界面、输入参数设置和步骤可参考下图:

代谢组学分析流程R语言 代谢组学kegg_数据_11

点击“Exec”按钮后,呈现的结果如下:

代谢组学分析流程R语言 代谢组学kegg_数据库_12



BlastKOALA工具

一种在线KEGG注释方法,具体操作界面、输入参数设置和步骤可参考下图:

代谢组学分析流程R语言 代谢组学kegg_系统功能_13

输入个人邮箱地址(确认任务提交是否成功),点击“Request for email confirmation”按钮后,呈现的结果如下:

代谢组学分析流程R语言 代谢组学kegg_数据_14

好啦,KEGG的内容实在是太多啦,短时间是没法讲完的,小美今天的分享就做到这里啦!不知道各位通过小编这简洁的介绍有没有感受到KEGG的“百科特色 ”呢?