Gene EcHS_A3305 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3305
Symbol	tdcB
ID	5592409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3313877
End bp	3314866
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	46%
IMG OID	640922423
Product	threonine dehydratase
Protein accession	YP_001459917
Protein GI	157162599
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01127] threonine dehydratase, medium form

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	0.0825845
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATATTA CATACGATCT GCCGGTTGCT ATTGATGACA TTATTGAAGC GAAACAACGA 
CTGGCTGGGC GAATTTATAA AACAGGCATG CCTCGCTCCA ACTATTTTAG TGAACGTTGC 
AAAGGTGAAA TATTCCTGAA GTTTGAAAAT ATGCAGCGTA CGGGTTCATT TAAAATTCGT 
GGCGCATTTA ATAAATTAAG TTCACTGACC GATGCGGAAA AACGCAAAGG CGTGGTGGCC 
TGTTCTGCGG GCAACCATGC GCAAGGGGTT TCCCTCTCCT GCGCGATGCT GGGTATCGAC 
GGTAAAGTGG TGATGCCAAA AGGTGCGCCA AAATCCAAAG TAGCGGCAAC GTGCGACTAC 
TCCGCAGAAG TCGTTCTGCA TGGTGATAAC TTCAACGACA CTATCGCTAA AGTGAGCGAA 
ATTGTCGAAA TGGAAGGCCG TATTTTTATT CCACCTTACG ATGATCCGAA AGTGATTGCT 
GGCCAGGGAA CGATTGGTCT GGAAATTATG GAAGATCTCT ATGATGTCGA TAACGTGATT 
GTGCCAATTG GTGGTGGCGG TTTAATTGCT GGTATTGCGG TGGCAATTAA ATCTATTAAC 
CCGACCATTC GTGTTATTGG CGTACAGTCT GAAAACGTTC ACGGCATGGC GGCTTCTTTC 
CACTCCGGAG AAATAACCAC GCACCGAACT ACCGGCACCC TGGCGGATGG TTGTGATGTC 
TCCCGCCCGG GTAATTTAAC TTACGAAATC GTTCGTGAAT TAGTCGATGA CATCGTGCTG 
GTCAGCGAAG ACGAAATCAG AAACAGTATG ATTGCCTTAA TTCAGCGCAA TAAAGTCGTC 
ACCGAAGGCG CAGGCGCTCT GGCATGTGCT GCATTATTAA GCGGTAAATT AGACCAATAT 
ATTCAAAACA GAAAAACCGT CAGTATTATT TCCGGCGGCA ATATCGATCT TTCTCGCGTC 
TCTCAAATCA CCGGTTTCGT TGACGCTTAA

Protein sequence

MHITYDLPVA IDDIIEAKQR LAGRIYKTGM PRSNYFSERC KGEIFLKFEN MQRTGSFKIR 
GAFNKLSSLT DAEKRKGVVA CSAGNHAQGV SLSCAMLGID GKVVMPKGAP KSKVAATCDY 
SAEVVLHGDN FNDTIAKVSE IVEMEGRIFI PPYDDPKVIA GQGTIGLEIM EDLYDVDNVI 
VPIGGGGLIA GIAVAIKSIN PTIRVIGVQS ENVHGMAASF HSGEITTHRT TGTLADGCDV 
SRPGNLTYEI VRELVDDIVL VSEDEIRNSM IALIQRNKVV TEGAGALACA ALLSGKLDQY 
IQNRKTVSII SGGNIDLSRV SQITGFVDA