Gene EcolC_0581 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0581
Symbol
ID	6066772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	624532
End bp	625521
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	46%
IMG OID	641599987
Product	threonine dehydratase
Protein accession	YP_001723584
Protein GI	170018630
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01127] threonine dehydratase, medium form

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.15708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATATTA CATACGATCT GCCGGTTGCT ATTGATGACA TTATTGAAGC GAAACAACGA 
CTGGCTGGGC GAATTTATAA AACAGGCATG CCTCGCTCCA ACTATTTTAG TGAACGTTGC 
AAAGGTGAAA TATTCCTGAA GTTTGAAAAT ATGCAGCGTA CGGGTTCATT TAAAATTCGT 
GGCGCATTTA ATAAATTAAG TTCACTGACC GATGCGGAAA AACGCAAAGG CGTGGTGGCC 
TGTTCTGCGG GCAACCATGC GCAAGGGGTT TCCCTCTCCT GCGCGATGCT GGGTATCGAC 
GGTAAAGTGG TGATGCCAAA AGGTGCGCCA AAATCCAAAG TAGCGGCAAC GTGCGACTAC 
TCCGCAGAAG TCGTTCTGCA TGGTGATAAC TTCAACGACA CTATCGCTAA AGTGAGCGAA 
ATTGTCGAAA TGGAAGGCCG TATTTTTATC CCACCTTACG ATGATCCGAA AGTGATTGCT 
GGCCAGGGAA CGATTGGTCT GGAAATTATG GAAGATCTCT ATGATGTCGA TAACGTGATT 
GTGCCAATTG GTGGTGGCGG TTTAATTGCT GGTATTGCGG TGGCAATTAA ATCTATTAAC 
CCGACCATTC GTGTTATTGG CGTACAGTCT GAAAACGTTC ACGGCATGGC GGCTTCTTTC 
CACTCCGGAG AAATAACCAC GCACCGAACT ACCGGCACCC TGGCGGATGG TTGTGATGTC 
TCCCGCCCGG GTAATTTAAC TTACGAAATC GTTCGTGAAT TAGTCGATGA CATCGTGCTG 
GTCAGCGAAG ACGAAATCAG AAACAGTATG ATTGCCTTAA TTCAGCGCAA TAAAGTCGTC 
ACCGAAGGCG CAGGCGCTCT GGCATGTGCT GCATTATTAA GCGGTAAATT AGACCAATAT 
ATTCAAAACA GAAAAACCGT CAGTATTATT TCCGGCGGCA ATATCGATCT TTCTCGCGTC 
TCTCAAATCA CCGGTTTCGT TGACGCTTAA

Protein sequence

MHITYDLPVA IDDIIEAKQR LAGRIYKTGM PRSNYFSERC KGEIFLKFEN MQRTGSFKIR 
GAFNKLSSLT DAEKRKGVVA CSAGNHAQGV SLSCAMLGID GKVVMPKGAP KSKVAATCDY 
SAEVVLHGDN FNDTIAKVSE IVEMEGRIFI PPYDDPKVIA GQGTIGLEIM EDLYDVDNVI 
VPIGGGGLIA GIAVAIKSIN PTIRVIGVQS ENVHGMAASF HSGEITTHRT TGTLADGCDV 
SRPGNLTYEI VRELVDDIVL VSEDEIRNSM IALIQRNKVV TEGAGALACA ALLSGKLDQY 
IQNRKTVSII SGGNIDLSRV SQITGFVDA