目录

Annotationhub构建orgdb

AnnotationHub构建OrgDb

要进行GO或者KEGG富集分析,就需要知道每个基因对应什么样的GO/KEGG分类,OrgDb就是存储不同数据库基因ID之间对应关系,以及基因与GO等注释的对应关系的 R 软件包

如果自己研究的物种不在 http://bioconductor.org/packages/release/BiocViews.html#___OrgDb 之列,很大可能就需要自己构建OrgDb,然后用clusterProfiler分析

利用AnnotationHub得到org.db

其中一种情况是在(AnnotationHub)中存在对应的注释包

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
require(AnnotationHub)
hub <- AnnotationHub()#下载失败多试几次
query(hub,"zea mays")

AnnotationHub with 8 records
# snapshotDate(): 2023-04-24
# $dataprovider: NCBI,DBCLS, ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/, WikiPathways
# $species: Zea mays, Zea mays_var._japonica
# $rdataclass: SQLiteFile, OrgDb, Tibble
# additional mcols(): taxonomyid, genome, description, coordinate_1_based, maintainer, rdatadateadded, preparerclass, tags,
#   rdatapath, sourceurl, sourcetype 
# retrieve records with, e.g., 'object[["AH91642"]]' 

             title                    
  AH91642  | MeSHDb for Zea mays (Corn, v001)   
  AH91817  | wikipathways_Zea_mays_metabolites.rda
  AH97909  | MeSHDb for Zea mays (Corn, v002)   
  AH100374 | MeSHDb for Zea mays (Corn, v003)   
  AH107139 | MeSHDb for Zea mays (Corn, v004)   
  AH111528 | MeSHDb for Zea mays (Corn, v005)   
  AH111691 | org.Zea_mays.eg.sqlite   
  AH111692 | org.Zea_mays_var._japonica.eg.sqlite 

阅读命令输出信息,可以看到

  • 数据库来源不同,选择需要的(org)以及确定物种(zea_mays)
  • retrieve records with, e.g., 'object[["AH111691"]]' 检索下载db用指定格式