Gene EcE24377A_4201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4201
Symbol
ID	5588263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4188612
End bp	4189760
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	52%
IMG OID	640927817
Product	galactonate dehydratase
Protein accession	YP_001465176
Protein GI	157158203
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCA CCAAAATTAC CACGTATCGT TTACCTCCCC GCTGGATGTT CCTGAAAATT 
GAAACCGATG AAGGCGTGGT CGGTTGGGGC GAGCCCGTGA TTGAAGGCCG CGCCCGTACG 
GTGGAAGCGG CAGTTCACGA GCTGGGTGAC TATTTGATTG GTCAGGATCC TTCGCGCATC 
AATGACTTAT GGCAAGTGAT GTATCGCGCC GGATTTTATC GTGGCGGTCC AATCCTGATG 
AGCGCCATTG CCGGGATCGA CCAGGCGTTA TGGGATATCA AAGGCAAAGT GCTGAATGCG 
CCGGTCTGGC AACTGATGGG CGGCCTGGTT CGCGACAAAA TTAAAGCCTA CAGTTGGGTC 
GGCGGCGATC GTCCGGCGGA TGTTATCGAC GGCATTAAAA CCCTGCGCGA AATCGGCTTC 
GATACTTTCA AACTGAACGG TTGTGAAGAA CTGGGGCTAA TTGATAACTC CCGCGCGGTA 
GATGCGGCAG TCAACACCGT GGCACAAATT CGTGAAGCTT TTGGCAATCA GATTGAGTTT 
GGTCTTGATT TCCACGGTCG CGTCAGCGCG CCAATGGCGA AAGTGCTGAT TAAAGAACTG 
GAGCCGTATC GCCCGCTGTT TATTGAAGAG CCGGTGCTGG CGGAACAAGC CGAATACTAC 
CCGAAACTGG CGGCACAAAC GCATATTCCA CTGGCGGCGG GTGAGCGCAT GTTCTCACGT 
TTCGATTTTA AACGCGTGCT GGAGGCAGGC GGTATTTCGA TTCTGCAACC GGATCTCTCC 
CATGCAGGCG GTATTACCGA ATGCTACAAA ATTGCTGGAA TGGCAGAAGC CTATGATGTG 
ACCCTTGCGC CGCACTGTCC GCTCGGACCG ATTGCACTGG CGGCTTGCCT GCATATCGAC 
TTTGTTTCCT ATAACGCGGT ACTTCAGGAA CAAAGTATGG GCATTCATTA CAACAAAGGC 
GCGGAGTTAC TCGACTTTGT GAAAAACAAA GAAGACTTCA GTATGGTTGG CGGCTTCTTT 
AAACCGTTAA CGAAACCGGG CTTAGGTGTG GAAATCGACG AAGCTAAAGT TATTGAGTTC 
AGTAAAAATG CCCCGGACTG GCGTAATCCG CTCTGGCGTC ATGAAGATAA CAGCGTAGCA 
GAGTGGTAA

Protein sequence

MKITKITTYR LPPRWMFLKI ETDEGVVGWG EPVIEGRART VEAAVHELGD YLIGQDPSRI 
NDLWQVMYRA GFYRGGPILM SAIAGIDQAL WDIKGKVLNA PVWQLMGGLV RDKIKAYSWV 
GGDRPADVID GIKTLREIGF DTFKLNGCEE LGLIDNSRAV DAAVNTVAQI REAFGNQIEF 
GLDFHGRVSA PMAKVLIKEL EPYRPLFIEE PVLAEQAEYY PKLAAQTHIP LAAGERMFSR 
FDFKRVLEAG GISILQPDLS HAGGITECYK IAGMAEAYDV TLAPHCPLGP IALAACLHID 
FVSYNAVLQE QSMGIHYNKG AELLDFVKNK EDFSMVGGFF KPLTKPGLGV EIDEAKVIEF 
SKNAPDWRNP LWRHEDNSVA EW