Gene Pars_2189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2189
Symbol
ID	5054398
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1960679
End bp	1962112
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	64%
IMG OID	640469741
Product	phosphoribosylamine--glycine ligase
Protein accession	YP_001154387
Protein GI	145592385
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0151] Phosphoribosylamine-glycine ligase
TIGRFAM ID	[TIGR00877] phosphoribosylamine--glycine ligase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAGGG TGCTTGTAAT TGGCGATGGG GCTCGGGAAC ACGCATTGGC GTGGGGGCTT 
GCGAGGAGCG GGGTTAGGCT CTACGCCTTG ATGGGGCACC TCAACCCGGG CGTTGCCCAG 
CTGGTGAGGG AGAGCGGGGG GTCGTACCGG CTTGGCTCCC CGACTAGCGC AGCGGAGGCG 
GTTAAGGCGG CTGAGGAGTT CTCCCCAGAC CTAGTGGTGG TTGGGCCGGA GGAGCCTCTC 
TTCGCTGGGG TCTCCGACGC GCTTAGGGAG AGAGGCTTCA TAACTCTAGG CGCGTCTTCT 
GGGGTGGCCA TTATTGAACA GAGGAAGGAC GTGGCGAGGG GCCTTCAGTG GAAGTACGGA 
GTCCCCGGGC GGCTGGTATA CGGCGTATTC GCAGACGTCG CTGAGGCCTA CTCCTTTGCC 
AAGGCCCTCG GCTCGGTGGC CATCAAGCCG GTTAGGCAGG CAGGTGGGAA GGGTGTGAGG 
GTGGTCTACG GGGAGGCCAA GTACCTAGAC AGCACGCTTG ACGAGGTCGT CGCCAGGGGG 
GCGCAGGAGG CAAAGGCCCA GCTGGCCTCG TACGGGGATG TGCCCCAGGC AGTGCTCGTG 
GAGGAGGCGG TGTGGGGGGT GGAGTACACG GTGCAGGCTC TTGTAGACGG CGAATCGGTC 
TTCGCGTTTC TCCCCGTACA GGACAACCCG CATGCCTACG AGCTTGGCCT TGGCCCGGAG 
TGCGGGGGCA TGGGCACCGT CTCTCCCCTG CCGTTTATAG AAGAGGGGGA ATTCCACGCG 
GCTGTTGAGG CGATTAAGGC GACGGCTGAG GCCGTGAGGC GCGAGTTCGG CGTGGAGTAC 
GTGGGCGTCT TAAGTGGGCA GATGATGCTC ACGGCAATGG GGCCTGTGGT TATTGAGTAC 
TACAGCAGGT TCGGCGATCC TGAGGCCCTA AACGCCGTCT ACCTCTACGA CGGCGATCTC 
TACGACTTGT TCCTAAAAGC GGCGACTAAA AAGCTACACA AGGCTCAGCG CAGGTTCAAG 
GCGGAGTACA CCGTGGTGAA GGCAATAGCC CCCCTGGGCT ACCCCCTCGA CAGGAGGCTG 
GCCGCGGGTA GGGTTTTCCA CGTGGATTGG GACGCGGTGA GGCGTGCCGG CTGCCTAGTC 
TTCTTCGGCT CGGCAGAGCC TGCTGAGGGC GGCGGGTACA AGACGCTGGG CTCCCGCGCC 
GTTGAGATAC TCGGCGCTGG GGCGACGCCA GAGGAGGCCT ACGAAAGGGC TGAGAGGTGC 
GCCGCCGCCG TCAAGGGGGA GGGCCTTTTC TACCGGAGCG ACATTGGCTC GCCGGAGTAC 
ATGGCGGCGA TGAAACGCAA AGCGGAACAG GTAAGAGCTG TCTACAAGTG GCGCGGCGAG 
CGGGGGGAGC GCTTGGTGTG GGAGCCGGGC AAGGGGCTGA TCCGCTTCGG GTGA

Protein sequence

MDRVLVIGDG AREHALAWGL ARSGVRLYAL MGHLNPGVAQ LVRESGGSYR LGSPTSAAEA 
VKAAEEFSPD LVVVGPEEPL FAGVSDALRE RGFITLGASS GVAIIEQRKD VARGLQWKYG 
VPGRLVYGVF ADVAEAYSFA KALGSVAIKP VRQAGGKGVR VVYGEAKYLD STLDEVVARG 
AQEAKAQLAS YGDVPQAVLV EEAVWGVEYT VQALVDGESV FAFLPVQDNP HAYELGLGPE 
CGGMGTVSPL PFIEEGEFHA AVEAIKATAE AVRREFGVEY VGVLSGQMML TAMGPVVIEY 
YSRFGDPEAL NAVYLYDGDL YDLFLKAATK KLHKAQRRFK AEYTVVKAIA PLGYPLDRRL 
AAGRVFHVDW DAVRRAGCLV FFGSAEPAEG GGYKTLGSRA VEILGAGATP EEAYERAERC 
AAAVKGEGLF YRSDIGSPEY MAAMKRKAEQ VRAVYKWRGE RGERLVWEPG KGLIRFG