Gene ECH74115_1031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1031
Symbol	ltaE
ID	6966822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1042761
End bp	1043762
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	56%
IMG OID	643385044
Product	L-threonine aldolase
Protein accession	YP_002269544
Protein GI	209400875
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2008] Threonine aldolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGATT TACGCAGTGA TACCGTAACC CGACCGAGCC GCGCCATGCT CGAAGCGATG 
ATGGCCGCCC CGGTTGGGGA CGACGTTTAC GGAGACGACC CTACCGTTAA TGCTCTGCAG 
GACTATGCAG CAGAGCTTTC CGGTAAAGAA GCCGCCATTT TTCTGCCTAC CGGCACTCAG 
GCCAACCTGG TCGCTCTGCT CAGTCACTGC GAACGCGGCG AAGAGTATAT TGTCGGTCAG 
GCCGCGCATA ACTATCTGTT TGAAGCCGGT GGCGCGGCGG TGCTGGGCAG TATTCAACCG 
CAACCCATCG ACGCGGCTGC CGACGGCACG CTACCGCTGG ATAAAGTGGC GATGAAAATC 
AAACCCGACG ATATCCATTT CGCCCGCACC AAATTACTCA GTCTGGAAAA CACCCACAAC 
GGCAAAGTGT TGCCGCGTGA ATACCTTAAA GATGCATGGG AATTTACCCG CGAGCGCAAT 
CTGGCGCTGC ATGTTGACGG TGCGCGCATC TTTAATGCCG TGGTGGCTTA CGGCAGCGAA 
CTGAAAGAGC TCACGCAATA TTGTGATTCG TTCACCATTT GCCTGTCGAA AGGTCTTGGG 
ACGCCAGTCG GTTCATTACT CGTCGGTAAT CGTGATTACA TTAAACGTGC CATTCGCTGG 
CGGAAAATGA CAGGTGGCGG GATGCGCCAG TCCGGCATTC TGGCTGCCGC CGGGATGTAT 
GCGCTGAAAA ATAACGTCGC ACGGTTGCAG GAAGATCACG ACAACGCCGC CTGGATGGCG 
GAGCAACTGC GTGAAGCAGG CGCGGATGTG ATGCGTCAGG ACACTAATAT GCTGTTTGTT 
CGCGTCGGCG AAGAAAATGC TGCCGCGTTA GGCGAATACA TGAAAGCGAG AAACGTACTG 
ATTAACGCCT CGCCGATTGT CCGCCTGGTG ACCCATCTTG ACGTCTCGCG CGAACAACTG 
GCAGAAGTCG CCGCCCACTG GCGCGCATTC CTGGCGCGTT AA

Protein sequence

MIDLRSDTVT RPSRAMLEAM MAAPVGDDVY GDDPTVNALQ DYAAELSGKE AAIFLPTGTQ 
ANLVALLSHC ERGEEYIVGQ AAHNYLFEAG GAAVLGSIQP QPIDAAADGT LPLDKVAMKI 
KPDDIHFART KLLSLENTHN GKVLPREYLK DAWEFTRERN LALHVDGARI FNAVVAYGSE 
LKELTQYCDS FTICLSKGLG TPVGSLLVGN RDYIKRAIRW RKMTGGGMRQ SGILAAAGMY 
ALKNNVARLQ EDHDNAAWMA EQLREAGADV MRQDTNMLFV RVGEENAAAL GEYMKARNVL 
INASPIVRLV THLDVSREQL AEVAAHWRAF LAR