Gene EcE24377A_4548 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4548
Symbol	purD
ID	5590010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4541647
End bp	4542936
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	58%
IMG OID	640928165
Product	phosphoribosylamine--glycine ligase
Protein accession	YP_001465501
Protein GI	157156020
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0151] Phosphoribosylamine-glycine ligase
TIGRFAM ID	[TIGR00877] phosphoribosylamine--glycine ligase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00000304372
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTAT TAGTGATTGG TAACGGCGGG CGCGAGCACG CGCTGGCCTG GAAAGCGGCG 
CAGTCGCCGC TGGTTGAAAC TGTTTTTGTT GCTCCGGGTA ATGCAGGCAC TGCGCTGGAA 
CCCGCGCTAC AGAACGTCGC TATCGGCGTA ACCGATATCC CGGCGCTGTT GGATTTCGCA 
CAAAACGAAA AGATTGATCT GACCATCGTC GGCCCGGAAG CGCCGCTGGT GAAAGGCGTG 
GTCGATACCT TCCGCGCCGC CGGGCTGAAA ATCTTCGGCC CAACCGCAGG TGCGGCCCAA 
CTGGAAGGCT CAAAAGCGTT TACCAAAGAT TTCCTGGCCC GCCATAAGAT CCCTACGGCG 
GAATACCAGA ACTTCACCGA GGTAGAACCT GCGCTGGCGT ATCTGCGTGA GAAAGGCGCG 
CCAATCGTCA TTAAAGCGGA CGGTCTGGCT GCCGGGAAAG GCGTTATCGT GGCGATGACG 
CTGGAAGAAG CGGAAGCGGC TGTTCACGAT ATGCTGGCGG GCAACGCTTT TGGCGACGCG 
GGTCATCGCA TCGTTATCGA AGAGTTCCTC GATGGCGAAG AAGCGAGCTT TATCGTGATG 
GTGGACGGCG AGCATGTGCT GCCGATGGCT ACCAGCCAGG ATCACAAACG CGTAGGCGAT 
AAAGATACCG GACCAAACAC CGGCGGGATG GGCGCTTACT CCCCCGCGCC GGTAGTAACC 
GATGAAGTTC ATCAGCGCAC CATGGAACGT ATCATCTGGC CAACCGTGAA AGGCATGGCG 
GCGGAAGGCA ACACCTACAC CGGTTTTCTC TACGCGGGCC TGATGATCGA CAAACAGGGC 
AATCCGAAGG TTATCGAATT TAACTGCCGC TTTGGCGATC CGGAAACCCA GCCGATTATG 
CTGCGCATGA AGTCCGATCT GGTTGAGCTC TGCCTGGCAG CCTGTGAAGG GAAGCTGGAC 
GAGAAAACAT CCGAGTGGGA TGAACGCGCT TCTCTCGGCG TGGTGATGGC TGCGGGTGGA 
TATCCGGGCG ATTACCGCAC CGGTGATGTG ATCCACGGCC TGCCGCTGGA AGAAGTGGAA 
GACGGCAAAG TGTTCCATGC AGGCACAAAA CTGGCGGATG ACGAGCAGGT AGTGACCAGC 
GGCGGGCGCG TACTGTGCGT CACCGCGCTG GGTCATACCG TGGCAGAAGC GCAGAAACGC 
GCTTATGCCT TAATGACCGA TATTCACTGG GACGACTGCT TCTGCCGGAA AGATATCGGC 
TGGCGCGCTA TCGAACGCGA GCAGAACTAA

Protein sequence

MKVLVIGNGG REHALAWKAA QSPLVETVFV APGNAGTALE PALQNVAIGV TDIPALLDFA 
QNEKIDLTIV GPEAPLVKGV VDTFRAAGLK IFGPTAGAAQ LEGSKAFTKD FLARHKIPTA 
EYQNFTEVEP ALAYLREKGA PIVIKADGLA AGKGVIVAMT LEEAEAAVHD MLAGNAFGDA 
GHRIVIEEFL DGEEASFIVM VDGEHVLPMA TSQDHKRVGD KDTGPNTGGM GAYSPAPVVT 
DEVHQRTMER IIWPTVKGMA AEGNTYTGFL YAGLMIDKQG NPKVIEFNCR FGDPETQPIM 
LRMKSDLVEL CLAACEGKLD EKTSEWDERA SLGVVMAAGG YPGDYRTGDV IHGLPLEEVE 
DGKVFHAGTK LADDEQVVTS GGRVLCVTAL GHTVAEAQKR AYALMTDIHW DDCFCRKDIG 
WRAIEREQN