Gene EcSMS35_3354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3354
Symbol	ddtA
ID	6146886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3431981
End bp	3432892
Gene Length	912 bp
Protein Length	303 aa
Translation table	11
GC content	54%
IMG OID	641618183
Product	tartrate dehydratase subunit alpha
Protein accession	YP_001745333
Protein GI	170683099
COG category	[C] Energy production and conversion
COG ID	[COG1951] Tartrate dehydratase alpha subunit/Fumarate hydratase class I, N-terminal domain
TIGRFAM ID	[TIGR00722] hydro-lyases, Fe-S type, tartrate/fumarate subfamily, alpha region

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.374954
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAGCG AAAGTAATAA GCAACAGGCA GTGAATAAGT TGACGGAGAT TGTCGCTAAC 
TTTACCGCCA TGATTTCTAC CCGAATGCCC GATGACGTGG TGGACAAACT AAAACAGCTA 
AAGGATGCCG AAACATCGTC GATGGGGAAA ATCATCTACC ACACGATGTT CGATAACATG 
CAAAAAGCGA TCGACCTGAA TCGTCCTGCC TGTCAGGACA CCGGCGAAAT CATGTTTTTT 
GTTAAGGTCG GTTCCCGTTT CCCACTGCTT GGCGAGCTGC AAAGCATACT CAAACAAGCC 
GTGGAAGAGG CAACCGTCAA AGCGCCACTG CGTCACAATG CGGTAGAAAT TTTTGACGAA 
GTAAACACCG GCAAAAATAC CGGCAGCGGT GTACCGTGGG TCACCTGGGA CATCATCCCC 
GACAATGACG ATGCGGAAAT CGAAGTTTAC ATGGCAGGCG GCGGCTGCAC GCTACCAGGC 
CGCTCGAAAG TGTTAATGCC GTCAGAAGGC TACGAAGGCG TAGTGAAATT CGTCTTCGAA 
AATATCTCCA CCCTCGCCGT AAACGCCTGT CCGCCGGTAC TTGTGGGCGT TGGCATCGCT 
ACCTCGGTGG AAACCGCCGC CGTGCTCTCG CGTAAAGCCA TTTTGCGCCC GATTGGCAGC 
CGCCACCCCA ATCCGAAAGC GGCAGAGCTG GAGCTACGCC TGGAAGAAGG ACTCAACCGT 
CTGGGGATTG GTCCACAAGG GCTGACTGGC AACAGTTCAG TGATGGGCGT ACATATCGAA 
TCTGCCGCCC GCCATCCGTC AACCATCGGC GTTGCTGTTT CTACAGGCTG CTGGGCGCAT 
CGTCGCGGCA CACTGCTGGT TCATGCCGAT CTCACCTTTG AAAATCTGTC TCACACCCGG 
AGCGCGTTAT GA

Protein sequence

MMSESNKQQA VNKLTEIVAN FTAMISTRMP DDVVDKLKQL KDAETSSMGK IIYHTMFDNM 
QKAIDLNRPA CQDTGEIMFF VKVGSRFPLL GELQSILKQA VEEATVKAPL RHNAVEIFDE 
VNTGKNTGSG VPWVTWDIIP DNDDAEIEVY MAGGGCTLPG RSKVLMPSEG YEGVVKFVFE 
NISTLAVNAC PPVLVGVGIA TSVETAAVLS RKAILRPIGS RHPNPKAAEL ELRLEEGLNR 
LGIGPQGLTG NSSVMGVHIE SAARHPSTIG VAVSTGCWAH RRGTLLVHAD LTFENLSHTR 
SAL