生物数据库
生物数据库是收集自科学实验、出版文献、高通量实验技术和计算分析等生命科学信息库,它包含来自基因组学、蛋白质组学、代谢组学、微阵列基因表达和系统发育学等领域的信息。
生物数据库大致可分为序列、结构和功能数据库。序列数据库储存核酸和蛋白质序列;结构数据库储存RNA和蛋白质的结构信息;功能数据库提供关于基因产物的生理作用信息(例如,酶活性、突变表型和生物途径等)。
数据库类型
生物数据库有两个常见的概念:一级数据库和二级数据库。一级数据库储存实验中获得数据;二级数据库使用其它数据库(例如,一级数据库)作为其信息源,然后根据需要进行处理或分析获得的结果。
数据库查找
查找生物数据库的重要资源是NAR(Nucleic Acids Research,核酸研究)期刊的特刊,它将许多与生物学和生物信息学相关的公开在线数据库分类,截止2018年共收录了1737个数据库。
NAR将所有数据库划分为15类,核苷酸序列数据库、RNA序列数据库、蛋白质序列数据库、结构数据库、基因组学数据库(非脊椎动物)、代谢和信号通路数据库、人类和其他脊椎动物基因组数据库、人类基因和疾病数据库、微阵列数据和其他基因表达数据库、蛋白质组学资源数据库、其他分子生物学数据库、细胞器数据库、植物数据库、免疫学数据库和细胞生物学数据库。
在线工具
NAR除了收录生物数据库,每年还发布可用于分子生物学数据分析和可视化的网络资源。
表1 2017年网络资源
Web Server name | URL | Brief description |
---|---|---|
agriGO v2 | http://systemsbiology.cau.edu.cn/agriGOv2/ | GO analysis for agricultural species |
AMMOS2 | http://drugmod.rpbs.univ-paris-diderot.fr/ammosHome.php | Energy minimization of protein–ligand complexes |
antiSMASH | http://antismash.secondarymetabolites.org/ | Secondary metabolite biosynthetic gene cluster mining in bacterial and fungal genomes |
ARTS | http://arts.ziemertlab.com | Biosynthetic gene cluster mining for novel antibiotics |
BAR 3.0 | http://bar.biocomp.unibo.it/bar3 | Protein structure and function annotation |
BepiPred-2.0 | http://www.cbs.dtu.dk/services/BepiPred-2.0/ | B-cell epitope prediction from a protein sequence |
BioAtlas | http://bioatlas.compbio.sdu.dk | Visualization of microbiome and metagenome locations |
BIS2Analyzer | http://www.lcqb.upmc.fr/BIS2Analyzer/ | Analysis of coevolving amino-acid pairs in protein sequences |
BusyBee | https://ccb-microbe.cs.uni-saarland.de/busybee | Metagenome binning |
CAFE | https://github.com/younglululu/CAFE | Stand-alone program for alignment-free comparison of metagenome data |
Cancer PanorOmics | http://panoromics.irbbarcelona.org | Mapping of cancer mutations to 3D protein–protein interaction sites |
COFACTOR | http://zhanglab.ccmb.med.umich.edu/COFACTOR/ | Structure-based protein function annotation |
compleXView | http://xvis.genzentrum.lmu.de/compleXView | Protein-protein interaction based on affinity purification mass spectrometry |
ConTra v3 | http://bioit2.irc.ugent.be/contra/v3 | Transcription factor binding sites analysis |
CPC2 | http://cpc2.cbi.pku.edu.cn | Protein coding potential of RNA transcripts |
CSPADE | http://cspade.fimm.fi/ | Chemoinformatics bioactivity assay visualization |
CSTEA | http://comp-sysbio.org/cstea/ | Analysis of time-series gene expression data on cell state transitions |
DEOGEN2 | http://deogen2.mutaframe.com/ | Prediction of deleterious mutations in proteins |
DNAproDB | http://dnaprodb.usc.edu | Structural analysis of DNA–protein complexes |
DSSR | http://jmol.x3dna.org | DNA and RNA structure visualization |
DynOmics | http://dyn.life.nthu.edu.tw/oENM/ | Protein molecular dynamics using elastic network models |
EBISearch | http://www.ebi.ac.uk/ebisearch | Web services text search in EMBL-EBI data |
FireProt | http://loschmidt.chemi.muni.cz/fireprot | Design of thermostable proteins |
GalaxyHomomer | http://galaxy.seoklab.org/cgi-bin/submit.cgi?type=HOMOMER | Prediction of protein homo-oligomer structure |
GASS-WEB | http://gass.unifei.edu.br/ | Identification of enzyme active sites |
GeMSTONE | http://gemstone.yulab.org/ | Genetic variant prioritization in human disease |
Gene ORGANizer | http://geneorganizer.huji.ac.il | Linkage of human genes to their affected body organs |
GenProBiS | http://genprobis.insilab.org | Mapping of SNPs to prot |