Gene ECH74115_4047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4047
Symbol
ID	6970013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3744842
End bp	3746182
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	53%
IMG OID	643387809
Product	glucarate dehydratase
Protein accession	YP_002272252
Protein GI	209397778
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID	[TIGR03247] glucarate dehydratase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCTC AATTTACGAC GCCTGTTGTT ACTGAAATGC AGGTCATCCC GGTGGCGGGC 
CATGACAGTA TGCTGATGAA TCTGAGTGGT GCACACGCAC CGTTCTTCAC GCGTAATATT 
GTGATTATCA AAGATAATTC TGGTCACACT GGCGTAGGGG AAATTCCCGG CGGCGAGAAA 
ATCCGTAAAA CGCTGGAAGA TGCAATTCCG CTGGTAGTGG GTAAAACGCT GGGTGAATAC 
AAAAACGTTC TGACGCTGGT GCGTAATACT TTTGCCGATC GTGATGCCGG CGGGCGCGGT 
TTGCAGACAT TTGATTTGCG TACCACTATT CATGTAGTTA CCGGGATAGA AGCGGCAATG 
CTGGATCTGC TGGGGCAGCA TCTGGGGGTT AACGTGGCAT CCCTGCTGGG CGATGGTCAA 
CAGCGTAGCG AAGTCGAAAT GCTCGGTTAT CTGTTCTTCG TCGGTAATCG CAAAGCCACA 
CCTCTGCCGT ATCAAAGCCA GCCGGATGAC TCATGCGACT GGTATCGCCT GCGTCATGAA 
GAAGCGATGA CGCCGGATGC GGTGGTGCGC CTGGCGGAAG CGGCGTATGA AAAATATGGC 
TTCAACGATT TCAAACTGAA AGGCGGTGTA CTGGCCGGGG AAGAAGAGGC CGAGTCTATT 
GTGGCACTGG CGCAACGCTT CCCGCAGGCG CGTATTACGC TCGATCCTAA CGGTGCCTGG 
TCGCTGAACG AAGCGATTAA AATCGGCAAA TACCTGAAAG GTTCGCTGGC TTATGCAGAA 
GATCCGTGTG GTGCGGAGCA AGGTTTCTCC GGGCGTGAAG TGATGGCAGA GTTCCGTCGC 
GCGACTGGCC TGCCGACTGC AACCAATATG ATCGCCACCG ACTGGCGGCA GATGGGCCAT 
ACGCTCTCGT TACAATCCGT TGATATCCCG CTGGCGGATC CGCATTTCTG GACAATGCAA 
GGTTCGGTAC GTGTGGCGCA AATGTGCCAT GAATTTGGCC TGACCTGGGG TTCACACTCT 
AACAACCACT TCGATATTTC CCTGGCGATG TTTACCCATG TTGCCGCCGC TGCACCGGGT 
AAAATTACTG CTATTGATAC GCACTGGATC TGGCAGGAAG GTAATCAGCG CCTGACCAAA 
GAACCGTTTG AGATCAAAGG CGGGCTGGTA CAGGTGCCAG AAAAACCGGG GCTGGGTGTA 
GAAATCGATA TGGATCAAGT GATGAAAGCC CATGAGCTGT ATCAGAAACA CGGGCTTGGC 
GCGCGTGACG ATGCGATGGG AATGCAGTAT CTGATTCCTG GCTGGACGTT CGATAACAAG 
CGCCCGTGCA TGGTGCGTTA A

Protein sequence

MSSQFTTPVV TEMQVIPVAG HDSMLMNLSG AHAPFFTRNI VIIKDNSGHT GVGEIPGGEK 
IRKTLEDAIP LVVGKTLGEY KNVLTLVRNT FADRDAGGRG LQTFDLRTTI HVVTGIEAAM 
LDLLGQHLGV NVASLLGDGQ QRSEVEMLGY LFFVGNRKAT PLPYQSQPDD SCDWYRLRHE 
EAMTPDAVVR LAEAAYEKYG FNDFKLKGGV LAGEEEAESI VALAQRFPQA RITLDPNGAW 
SLNEAIKIGK YLKGSLAYAE DPCGAEQGFS GREVMAEFRR ATGLPTATNM IATDWRQMGH 
TLSLQSVDIP LADPHFWTMQ GSVRVAQMCH EFGLTWGSHS NNHFDISLAM FTHVAAAAPG 
KITAIDTHWI WQEGNQRLTK EPFEIKGGLV QVPEKPGLGV EIDMDQVMKA HELYQKHGLG 
ARDDAMGMQY LIPGWTFDNK RPCMVR