Gene ECH74115_4373 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4373
Symbol	ddtA
ID	6966744
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4049076
End bp	4049987
Gene Length	912 bp
Protein Length	303 aa
Translation table	11
GC content	54%
IMG OID	643388096
Product	tartrate dehydratase subunit alpha
Protein accession	YP_002272534
Protein GI	209396443
COG category	[C] Energy production and conversion
COG ID	[COG1951] Tartrate dehydratase alpha subunit/Fumarate hydratase class I, N-terminal domain
TIGRFAM ID	[TIGR00722] hydro-lyases, Fe-S type, tartrate/fumarate subfamily, alpha region

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0282958
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	80
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAGCG AAAGTAATAA GCAACAGGCA GTGAATAAGT TGACGGAGAT TGTCGCTAAC 
TTTACCGCCA TGATTTCTAC CCGAATGCCT GATGACGTGG TGGATAAACT AAAACAGCTA 
AAGGATGCCG AAACGTCGTC GATGGGGAAA ATTATCTACC ATACGATGTT CGACAACATG 
CAAAAAGCGA TTGACCTGAA TCGTCCTGCC TGTCAGGACA CCGGGGAGAT TATGTTCTTC 
GTTAAAGTCG GTTCCCGCTT CCCACTGCTT GGCGAGCTGC AAAGCATACT CAAACAAGCC 
GTGGAAGAGG CGACCATCAA AGCGCCGCTG CGTCACAATG CGGTAGAAAT TTTTGACGAA 
GTAAACACCG GCAAAAATAC CGGTAGCGGC GTACCGTGGG TCACCTGGGA TATCGTCCCC 
GACGGTGACG ATGCGGAAAT CGAAGTTTAC ATGGCAGGCG GCGGCTGCAC GCTACCAGGC 
CGCTCGAAAG TGTTAATGCC GTCAGAAGGC TACGAAGGCG TGGTGAAATT CGTCTTCGAA 
AATATCTCCA CCCTCGCAGT AAACGCCTGT CCACCGGTAC TGGTGGGCGT GGGCATCGCC 
ACCTCGGTGG AAACCGCCGC CGTACTCTCG CGTAAAGCCA TTTTGCGCCC GATTGGCAGC 
CGCCACCCCA ATCCAAAAGC GGCAGAGCTG GAGCTACGCC TGGAAGAAGG ACTCAACCGT 
CTGGGGATTG GTCCACAAGG GCTAACTGGC AACAGTTCAG TGATGGGCGT GCATATCGAA 
TCTGCCGCCC GCCATCCGTC AACCATCGGC GTTGCTGTTT CTACCGGTTG CTGGGCGCAT 
CGTCGCGGCA CACTGCTGGT TCATGCCGAT CTCACCTTTG AAAATCTGTC TCACACCCGG 
AGCGCGTTAT GA

Protein sequence

MMSESNKQQA VNKLTEIVAN FTAMISTRMP DDVVDKLKQL KDAETSSMGK IIYHTMFDNM 
QKAIDLNRPA CQDTGEIMFF VKVGSRFPLL GELQSILKQA VEEATIKAPL RHNAVEIFDE 
VNTGKNTGSG VPWVTWDIVP DGDDAEIEVY MAGGGCTLPG RSKVLMPSEG YEGVVKFVFE 
NISTLAVNAC PPVLVGVGIA TSVETAAVLS RKAILRPIGS RHPNPKAAEL ELRLEEGLNR 
LGIGPQGLTG NSSVMGVHIE SAARHPSTIG VAVSTGCWAH RRGTLLVHAD LTFENLSHTR 
SAL