Gene EcSMS35_3413 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3413
Symbol	tdcB
ID	6144404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3495267
End bp	3496256
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	47%
IMG OID	641618242
Product	threonine dehydratase
Protein accession	YP_001745391
Protein GI	170683614
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01127] threonine dehydratase, medium form

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATATTA CATACGATCT CCCGGTTGCT ATTGATGACA TCATTGAAGC AAAACAACGA 
CTGGCTGGGC GAATTTATAA AACAGGCATG CCTCGCTCCA ACTATTTTAG TGAACGTTGC 
AAAGGTGAAA TATTCCTCAA ATTCGAAAAC ATGCAGCGTA CGGGTTCATT TAAAATTCGT 
GGCGCATTTA ATAAATTAAG TTCACTGACC GATGCGGAAA AACGCAAAGG CGTGGTGGCC 
TGTTCTGCGG GCAACCATGC GCAAGGGGTT TCCCTCTCCT GCGCGATGCT GGGCATCGAC 
GGTAAAGTGG TGATGCCAAA AGGTGCGCCA AAATCCAAAG TAGCGGCAAC GTGCGACTAC 
TCCGCAGAAG TCGTTCTGCA TGGTGATAAC TTCAACGACA CTATCGCTAA AGTGAGCGAA 
ATTGTCGAAA TGGAAGGCCG TATTTTTATC CCACCTTACG ATGATCCGAA AGTGATTGCT 
GGCCAGGGAA CGATTGGTCT GGAAATTATG GAAGATCTCT ATGATGTCGA TAACGTGATT 
GTGCCAATTG GTGGTGGCGG TTTAATTGCT GGTATTGCGG TGGCAATTAA ATCTATTAAC 
CCGACCATTC GTGTTATTGG CGTACAGTCT GAAAACGTTC ACGGCATGGC GGCTTCTTTC 
CACTCCGGAG AAATAACCAC GCACCGAACT ACCGGCACCC TGGCGGATGG TTGTGATGTC 
TCCCGCCCGG GTAATTTAAC TTACGAAATC GTTCGTGAAT TAGTCGATGA CATCGTGCTG 
GTCAGCGAAG ACGAAATCAG AAACAGTATG ATTGCCTTAA TTCAGCGCAA TAAAGTCGTC 
ACCGAAGGCG CAGGCGCTCT GGCATGTGCT GCATTATTAA GCGGTAAATT AGACCAATAT 
ATTCAAAACA GAAAAACCGT CAGTATTATT TCCGGCGGCA ATATCGATCT TTCTCGCGTC 
TCTCAAATCA CCGGTTTCGT TGACGCTTAA

Protein sequence

MHITYDLPVA IDDIIEAKQR LAGRIYKTGM PRSNYFSERC KGEIFLKFEN MQRTGSFKIR 
GAFNKLSSLT DAEKRKGVVA CSAGNHAQGV SLSCAMLGID GKVVMPKGAP KSKVAATCDY 
SAEVVLHGDN FNDTIAKVSE IVEMEGRIFI PPYDDPKVIA GQGTIGLEIM EDLYDVDNVI 
VPIGGGGLIA GIAVAIKSIN PTIRVIGVQS ENVHGMAASF HSGEITTHRT TGTLADGCDV 
SRPGNLTYEI VRELVDDIVL VSEDEIRNSM IALIQRNKVV TEGAGALACA ALLSGKLDQY 
IQNRKTVSII SGGNIDLSRV SQITGFVDA