Gene EcHS_A3904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3904
Symbol
ID	5591957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3899021
End bp	3900169
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	53%
IMG OID	640923012
Product	galactonate dehydratase
Protein accession	YP_001460489
Protein GI	157163171
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	79
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCA CCAAAATTAC CACGTATCGT TTACCTCCCC GCTGGATGTT CCTGAAAATT 
GAAACCGATG AAGGCGTGGT CGGTTGGGGC GAGCCCGTGA TCGAAGGCCG CGCCCGTACG 
GTGGAAGCGG CAGTTCACGA GCTGGGTGAC TATTTGATTG GTCAGGATCC ATCGCGCATC 
AATGACTTAT GGCAAGTGAT GTATCGCGCC GGATTCTATC GCGGCGGTCC GATCCTGATG 
AGCGCCATCG CCGGGATTGA CCAGGCGTTA TGGGATATCA AAGGTAAAGT GCTGAATGCG 
CCGGTCTGGC AACTGATGGG CGGCCTGGTT CGCGACAAAA TTAAAGCCTA CAGTTGGGTC 
GGCGGCGATC GTCCGGCGGA TGTTATCGGC GGCATTAAAA CCCTGCGCGA AATCGGCTTC 
GATACCTTCA AACTGAACGG TTGTGAAGAA CTGGGGCTAA TTGATAACTC CCGCGCGGTA 
GATGCGGCAG TCAACACCGT GGCACAAATT CGTGAAGCTT TTGGCAATCA GATTGAGTTT 
GGTCTTGATT TCCACGGTCG CGTCAGCGCG CCGATGGCGA AAGTGCTGAT TAAAGAACTG 
GAGCCGTATC GCCCGCTGTT TATTGAAGAG CCGGTGCTGG CAGAACAAGC CGAATACTAC 
CCGAAACTGG CGGCACAAAC GCATATTCCA CTGGCGGCGG GTGAGCGCAT GTTCTCACGC 
TTCGATTTTA AACGCGTGCT GGAGGCAGGC GGTATTTCGA TTCTGCAACC GGATCTCTCC 
CATGCAGGCG GTATTACTGA ATGCTACAAA ATTGCCGGAA TGGCAGAAGC CTATGATGTG 
ACCCTTGCGC CGCACTGTCC GCTCGGACCG ATTGCACTGG CGGCTTGCCT GCATATCGAC 
TTTGTTTCCT ATAACGCCGT ACTTCAGGAA CAAAGTATGG GCATTCATTA CAACAAAGGC 
GCGGAGTTAC TCGACTTTGT GAAAAACAAA GAGGACTTCA GCATGGTTGG CGGCTTCTTT 
AAACCGCTAA CGAAACCGGG CTTAGGCGTG GAAATCGACG AAGCTAAAGT TATTGAGTTC 
AGTAAAAATG CCCCGGACTG GCGTAATCCG CTCTGGCGTC ATGAAGATAA CAGCGTAGCA 
GAGTGGTAA

Protein sequence

MKITKITTYR LPPRWMFLKI ETDEGVVGWG EPVIEGRART VEAAVHELGD YLIGQDPSRI 
NDLWQVMYRA GFYRGGPILM SAIAGIDQAL WDIKGKVLNA PVWQLMGGLV RDKIKAYSWV 
GGDRPADVIG GIKTLREIGF DTFKLNGCEE LGLIDNSRAV DAAVNTVAQI REAFGNQIEF 
GLDFHGRVSA PMAKVLIKEL EPYRPLFIEE PVLAEQAEYY PKLAAQTHIP LAAGERMFSR 
FDFKRVLEAG GISILQPDLS HAGGITECYK IAGMAEAYDV TLAPHCPLGP IALAACLHID 
FVSYNAVLQE QSMGIHYNKG AELLDFVKNK EDFSMVGGFF KPLTKPGLGV EIDEAKVIEF 
SKNAPDWRNP LWRHEDNSVA EW