Gene EcHS_A4239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4239
Symbol	purD
ID	5595424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4234203
End bp	4235492
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	58%
IMG OID	640923343
Product	phosphoribosylamine--glycine ligase
Protein accession	YP_001460792
Protein GI	157163474
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0151] Phosphoribosylamine-glycine ligase
TIGRFAM ID	[TIGR00877] phosphoribosylamine--glycine ligase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.00124381
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTAT TAGTGATTGG TAACGGCGGG CGCGAGCACG CGCTGGCCTG GAAAGCGGCC 
CAGTCGCCGC TGGTTGAGAC TGTTTTTGTT GCTCCGGGTA ATGCAGGCAC TGCGCTGGAA 
CCCGCGCTGC AAAACGTTGC TATTGGCGTG ACCGATATCC CGGCGCTGTT GGATTTCGCA 
CAAAACGAAA AGATTGATCT GACCATCGTC GGCCCGGAAG CGCCGCTGGT GAAAGGCGTG 
GTCGATACCT TCCGCGCCGC CGGGCTGAAA ATCTTCGGCC CAACCGCAGG TGCGGCCCAA 
CTGGAAGGCT CAAAAGCGTT TACCAAAGAT TTCCTGGCCC GCCATAAGAT CCCTACGGCG 
GAATACCAGA ACTTCACCGA GGTAGAACCT GCGCTGGCGT ATCTGCGTGA GAAAGGCGCG 
CCAATCGTCA TTAAAGCGGA CGGTCTGGCT GCCGGGAAAG GCGTTATCGT GGCGATGACG 
CTGGAAGAAG CGGAAGCGGC TGTTCACGAT ATGCTGGCGG GCAACGCTTT TGGCGACGCG 
GGTCATCGCA TCGTTATCGA AGAGTTCCTC GATGGCGAAG AAGCGAGCTT TATCGTGATG 
GTGGACGGCG AGCATGTGTT GCCGATGGCT ACCAGCCAGG ATCACAAACG CGTAGGCGAT 
AAAGATACCG GACCAAACAC GGGCGGGATG GGCGCTTACT CCCCCGCGCC GGTAGTAACC 
GATGAAGTTC ATCAGCGCAC CATGGAACGT ATCATCTGGC CAACCGTGAA AGGCATGGCG 
GCGGAAGGCA ACACCTACAC CGGTTTTCTC TACGCGGGCC TGATGATCGA CAAACAGGGC 
AATCCGAAGG TTATCGAATT TAACTGCCGC TTTGGCGATC CGGAAACCCA GCCGATTATG 
CTGCGCATGA AGTCCGATCT GGTTGAGCTC TGCCTGGCAG CCTGTGAAGG GAAGCTGGAC 
GAGAAAACAT CCGAGTGGGA TGAACGCGCT TCTCTCGGCG TGGTGATGGC TGCGGGTGGA 
TATCCGGGCG ATTACCGCAC CGGCGATGTG ATCCACGGCC TGCCGCTGGA AGAAGTGGCT 
GACGGCAAAG TGTTCCACGC GGGCACGAAA CTGGCGGATA ACGAGCAGGT AGTGACCAGC 
GGCGGGCGCG TACTGTGCGT CACCGCGCTG GGTCATACCG TGGCAGAAGC GCAGAAACGC 
GCTTATGCCT TAATGACCGA TATTCACTGG GACGACTGCT TCTGCCGGAA AGATATTGGC 
TGGCGCGCTA TCGAACGCGA GCAGAACTAA

Protein sequence

MKVLVIGNGG REHALAWKAA QSPLVETVFV APGNAGTALE PALQNVAIGV TDIPALLDFA 
QNEKIDLTIV GPEAPLVKGV VDTFRAAGLK IFGPTAGAAQ LEGSKAFTKD FLARHKIPTA 
EYQNFTEVEP ALAYLREKGA PIVIKADGLA AGKGVIVAMT LEEAEAAVHD MLAGNAFGDA 
GHRIVIEEFL DGEEASFIVM VDGEHVLPMA TSQDHKRVGD KDTGPNTGGM GAYSPAPVVT 
DEVHQRTMER IIWPTVKGMA AEGNTYTGFL YAGLMIDKQG NPKVIEFNCR FGDPETQPIM 
LRMKSDLVEL CLAACEGKLD EKTSEWDERA SLGVVMAAGG YPGDYRTGDV IHGLPLEEVA 
DGKVFHAGTK LADNEQVVTS GGRVLCVTAL GHTVAEAQKR AYALMTDIHW DDCFCRKDIG 
WRAIEREQN