Gene EcolC_0925 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0925
Symbol
ID	6068564
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1001320
End bp	1002660
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	53%
IMG OID	641600333
Product	glucarate dehydratase
Protein accession	YP_001723921
Protein GI	170018967
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID	[TIGR03247] glucarate dehydratase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCTC AATTTACGAC GCCTGTTGTT ACTGAAATGC AGGTCATCCC GGTGGCGGGT 
CATGACAGTA TGCTGATGAA TCTGAGTGGT GCACACGCAC CGTTCTTCAC GCGTAATATT 
GTGATTATCA AAGATAATTC TGGTCACACT GGCGTAGGGG AAATTCCCGG CGGCGAGAAA 
ATCCGTAAAA CGCTGGAAGA TGCGATTCCG CTGGTGGTAG GTAAAACGCT GGGTGAATAC 
AAAAACGTTC TGACGCTGGT GCGTAATACT TTTGCCGATC GTGATGCCGG CGGGCGCGGT 
TTGCAGACAT TTGATTTGCG TACCACTATT CATGTAGTTA CCGGGATAGA AGCGGCAATG 
CTGGATCTGT TGGGGCAGCA TCTGGGGGTA AACGTGGCAT CGTTGCTGGG CGATGGCCAA 
CAGCGTAGCG AAGTCGAAAT GCTCGGTTAT CTGTTCTTCG TCGGTAATCG CAAAGCCACA 
CCGCTGCCGT ATCAAAGCCA GCCGGATGAT TCATGCGACT GGTATCGCCT GCGTCATGAA 
GAAGCGATGA CACCGGATGC GGTGGTGCGC CTGGCGGAAG CGGCGTATGA AAAATATGGC 
TTCAACGATT TCAAACTGAA AGGCGGTGTA CTGGCCGGGG AAGAAGAAGC CGAGTCTATT 
GTGGCACTGG CGAAACGTTT CCCGCAGGCG CGTATTACGC TCGATCCTAA CGGTGCCTGG 
TCGCTGAACG AAGCGATTAA AATTGGTAAA TACCTGAAAG GGTCGCTGGC TTATGCAGAA 
GATCCGTGTG GTGCGGAGCA AGGTTTCTCC GGGCGTGAAG TGATGGCAGA GTTCCGTCGC 
GCGACTGGCC TGCCGACTGC AACCAATATG ATCGCCACCG ACTGGCGGCA GATGGGCCAT 
ACACTCTCGT TACAATCCGT TGATATCCCG CTGGCGGATC CGCATTTCTG GACGATGCAA 
GGTTCGGTAC GTGTGGCGCA AATGTGCCAT GAATTTGGCC TGACCTGGGG TTCACACTCA 
AACAACCACT TCGATATTTC CCTGGCGATG TTTACCCATG TTGCCGCCGC TGCACCGGGT 
AAAATTACTG CTATTGATAC GCACTGGATC TGGCAGGAAG GTAATCAGCG CCTGACCAAA 
GAACCGTTTG AGATCAAAGG CGGGCTGGTA CAGGTGCCAG AAAAACCGGG ACTGGGTGTA 
GAAATCGATA TGGATCAAGT GATGAAAGCC CATGAGCTGT ATCAGAAACA CGGGCTTGGC 
GCGCGTGACG ATGCGATGGG AATGCAGTAT CTGATTCCTG GCTGGACGTT CGATAACAAG 
CGCCCGTGCA TGGTGCGTTA A

Protein sequence

MSSQFTTPVV TEMQVIPVAG HDSMLMNLSG AHAPFFTRNI VIIKDNSGHT GVGEIPGGEK 
IRKTLEDAIP LVVGKTLGEY KNVLTLVRNT FADRDAGGRG LQTFDLRTTI HVVTGIEAAM 
LDLLGQHLGV NVASLLGDGQ QRSEVEMLGY LFFVGNRKAT PLPYQSQPDD SCDWYRLRHE 
EAMTPDAVVR LAEAAYEKYG FNDFKLKGGV LAGEEEAESI VALAKRFPQA RITLDPNGAW 
SLNEAIKIGK YLKGSLAYAE DPCGAEQGFS GREVMAEFRR ATGLPTATNM IATDWRQMGH 
TLSLQSVDIP LADPHFWTMQ GSVRVAQMCH EFGLTWGSHS NNHFDISLAM FTHVAAAAPG 
KITAIDTHWI WQEGNQRLTK EPFEIKGGLV QVPEKPGLGV EIDMDQVMKA HELYQKHGLG 
ARDDAMGMQY LIPGWTFDNK RPCMVR