Gene Cthe_1381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1381
Symbol
ID	4809376
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1685147
End bp	1686646
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	40%
IMG OID	640106805
Product	threonine synthase
Protein accession	YP_001037806
Protein GI	125973896
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATTATG AAAGTACACG AGGGGGATTA AAATCTGTAT CATCTGCTGA AGCTATAAAA 
AGGGGTATAG CGCCGGACGG TGGATTGTTT GTCCCGGAGA ATAAAGTAAG TTTTACCGGT 
AGTGAAATTA GCGCCATGGC TGATATGAGT TATCAGGAAA GGGCGTTATA TATATTAAAG 
CACTATCTTA CGGATTATAG CGATGAAGAA ATAGCGGACT GTGTTTACAA TGCCTATACC 
GATGAAAAGT TCGACGACAA AAGAATTGCT CCCTTGGTTC AGCTGAATGA AAATGTCAAT 
ATCCTGGAAT TGTGGCACGG ACCAACATGT GCATTCAAAG ACATGGCACT TCAAATATTG 
CCTCATTTCC TTGTAAAGGC AGTGAGAAAA ACCGGCGAAA CCGGTGAAAT CGTAATTTTG 
GTTGCAACTT CAGGAGATAC CGGAAAAGCT GCTTTGGAAG GTTTTAAGGA TGTTGAGGGC 
ACAAGAATAA TTGTGTTCTA TCCCCAGGAT GGCGTAAGCC AGGTTCAGAA AATGCAAATG 
GTCACCCAGG AAGGAAAAAA TGTTTACACC ATAGGAGTGG AAGGAAATTT TGACGACGCA 
CAAAGCGGAG TAAAAGCAAT TTTTACCGAT GAAGAACTTA AGCAGAAAAT GGACAAAGGC 
AATTTCAAAT TTTCATCGGC GAATTCCATT AACTGGGGGA GACTTGTACC TCAGATAGTC 
TATTATTTTT CGGCATATGC TGATATGCTG AAGAACGGTG AAATAAAAGA GGGAGACAAG 
ATTAACTTTG TTGTCCCCAC AGGAAATTTC GGAAATATTC TTGCGGCTTT CTATGCAATG 
CAAATGGGGC TTCCTGTAAA CAGGCTCATT TGTGCGTCCA ATGACAATAA TGTTTTAACC 
GATTTTATCA ATACAGGAGT ATATGACAAA AACAGGGAGT TTAAGAGGAC CATTTCGCCG 
TCTATGGACA TATTGATTTC AAGCAACCTT GAAAGACTCC TCTTTGAACT TACCGGACAT 
GATCCTTTGC CGGTGAACAA TTGGATGAGC AGTTTGAAAG AAACCGGAAA ATATACTGTT 
GACAATACAA TGAAGAAAAA GATATCGGAA ATATTCTGGG GCGGATATTC AAACGAGGCT 
GAAACTTTAA AGACGATAGA GGCTATATAC AAGGAATACG GATATGTCAT TGATACCCAT 
ACTGCTGTAG GTGTTGATGT GTATGACAAA TATGTAATTT CCACCGGTGA CGTGACAAAG 
ACGGTCATTG CGTCAACGGC AAGTCCTTTC AAATTTAATG AAAGTGTGGT AAAAGCAGTT 
TTGGGAAATG AAGCGTTAAA AGGAAGGACG GAATTTGAAC TTCTTGAGGT TTTGGCAAAA 
GAGTGCAGGC TTAAAATACC GGAAGGTTTG AAAGATCTTG ACAAAAAGCC TGTGCTTCAC 
AAACAGGTTT GCAGTAAATT TGATATGAAA CAGCAGGTTG AAAGTATTCT TGGTCTGTAA

Protein sequence

MYYESTRGGL KSVSSAEAIK RGIAPDGGLF VPENKVSFTG SEISAMADMS YQERALYILK 
HYLTDYSDEE IADCVYNAYT DEKFDDKRIA PLVQLNENVN ILELWHGPTC AFKDMALQIL 
PHFLVKAVRK TGETGEIVIL VATSGDTGKA ALEGFKDVEG TRIIVFYPQD GVSQVQKMQM 
VTQEGKNVYT IGVEGNFDDA QSGVKAIFTD EELKQKMDKG NFKFSSANSI NWGRLVPQIV 
YYFSAYADML KNGEIKEGDK INFVVPTGNF GNILAAFYAM QMGLPVNRLI CASNDNNVLT 
DFINTGVYDK NREFKRTISP SMDILISSNL ERLLFELTGH DPLPVNNWMS SLKETGKYTV 
DNTMKKKISE IFWGGYSNEA ETLKTIEAIY KEYGYVIDTH TAVGVDVYDK YVISTGDVTK 
TVIASTASPF KFNESVVKAV LGNEALKGRT EFELLEVLAK ECRLKIPEGL KDLDKKPVLH 
KQVCSKFDMK QQVESILGL