Gene EcSMS35_1589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1589
Symbol	fumC
ID	6146349
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1575901
End bp	1577304
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	54%
IMG OID	641616465
Product	fumarate hydratase
Protein accession	YP_001743643
Protein GI	170681319
COG category	[C] Energy production and conversion
COG ID	[COG0114] Fumarase
TIGRFAM ID	[TIGR00979] fumarate hydratase, class II

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.194502
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACAG TACGCAGCGA AAAAGATTCG ATGGGGGCGA TTGATGTCCC GGCAGATAAG 
CTGTGGGGCG CACAAACTCA ACGCTCGCTG GAGCATTTCC GCATTTCGAC GGAGAAAATG 
CCCACCTCAC TGATTCATGC GCTGGCACTA ACCAAGCGCG CAGCGGCAAA AGTTAATGAA 
GATTTAGGCT TGTTGTCTGA AGAGAAAGCG AGCGCCATTC GTCAGGCGGC GGATGAAGTA 
CTGGCAGGAC AGCATGACGA CGAATTCCCG CTGGCTATCT GGCAGACCGG CTCCGGCACG 
CAAAGTAATA TGAACATGAA CGAAGTGCTG GCTAATCGGG CCAGTGAATT ACTTGGCGGC 
GTGCGCGGGA TGGAGCGTAA AGTTCACCCT AACGACGACG TGAACAAAAG CCAAAGTTCC 
AATGATGTCT TTCCGACGGC GATGCACGTT GCGGCGCTAC TGGCGCTGCG CAAGCAACTC 
ATTCCGCAGC TTAAAACCCT GACACAGACA CTGAATGAGA AATCCCGTGC ATTTGCCGAT 
ATCGTCAAAA TCGGTCGAAC CCACTTGCAG GATGCCACGC CGCTAACACT GGGGCAGGAG 
ATTTCCGGCT GGGTAGCGAT GCTCGAGCAT AATCTCAAAC ATATCGAATA CAGCCTGCCG 
CATGTAGCGG AACTGGCTCT TGGCGGTACA GCGGTGGGTA CTGGACTAAA TACCCATCCG 
GAGTATGCGC GTCGAGTAGC AGATGAACTG GCAGTCATTA CCTGCGCTCC GTTTGTTACC 
GCGCCGAACA AATTTGAAGC GCTGGCGACC TGTGATGCCC TGGTTCAGGC GCACGGCGCG 
TTGAAAGGGT TGGCTGCGTC ACTGATGAAA ATTGCCAATG ATGTCCGCTG GCTGGCCTCT 
GGCCCGCGCT GTGGAATTGG TGAAATCGCA ATCCCGGAAA ATGAGCCGGG CAGCTCAATC 
ATGTCGGGGA AAGTGAACCC AACCCAGTGT GAGGCATTAA CCATGCTTTG CTGTCAGGTG 
ATGGGGAACG ACGTGGCGAT CAACATGGGT GGCGCTTCCG GTAACTTTGA ACTGAACGTC 
TTCCGTCCGA TGGTGATTCA TAATTTCCTG CAATCGGTGC GCTTGCTGGC AGATGGCATG 
GAAAGTTTCA ACAAACACTG TGCAGTGGGC ATTGAACCGA ATCGTGAGCG AATCAATCAA 
TTACTCAATG AATCGCTGAT GCTGGTGACT GCGCTTAACA CCCACATTGG TTATGACAAA 
GCCGCCGAGA TCGCCAAAAA AGCGCATAAA GAAGGGCTGA CCTTAAAAGC TGCGGCCCTT 
GCGCTGGGGT ATCTTAGCGA AGCCGAGTTT GACAGCTGGG TACGGCCAGA ACAGATGGTC 
GGCAGTATGA AAGCCGGGGG TTAA

Protein sequence

MNTVRSEKDS MGAIDVPADK LWGAQTQRSL EHFRISTEKM PTSLIHALAL TKRAAAKVNE 
DLGLLSEEKA SAIRQAADEV LAGQHDDEFP LAIWQTGSGT QSNMNMNEVL ANRASELLGG 
VRGMERKVHP NDDVNKSQSS NDVFPTAMHV AALLALRKQL IPQLKTLTQT LNEKSRAFAD 
IVKIGRTHLQ DATPLTLGQE ISGWVAMLEH NLKHIEYSLP HVAELALGGT AVGTGLNTHP 
EYARRVADEL AVITCAPFVT APNKFEALAT CDALVQAHGA LKGLAASLMK IANDVRWLAS 
GPRCGIGEIA IPENEPGSSI MSGKVNPTQC EALTMLCCQV MGNDVAINMG GASGNFELNV 
FRPMVIHNFL QSVRLLADGM ESFNKHCAVG IEPNRERINQ LLNESLMLVT ALNTHIGYDK 
AAEIAKKAHK EGLTLKAAAL ALGYLSEAEF DSWVRPEQMV GSMKAGG