Gene Cthe_2221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2221
Symbol
ID	4811086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2650194
End bp	2651363
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	42%
IMG OID	640107627
Product	DegT/DnrJ/EryC1/StrS aminotransferase
Protein accession	YP_001038616
Protein GI	125974706
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0399] Predicted pyridoxal phosphate-dependent enzyme apparently involved in regulation of cell wall biogenesis
TIGRFAM ID	[TIGR03588] UDP-4-keto-6-deoxy-N-acetylglucosamine 4-aminotransferase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGAAAA GTGCGGAGCA GAAATTCATA CCTTACGGGT GCCAATGGAT TGAGGAAGAT 
GATATTAATG CCGTGGTTGA GGTATTAAGA GGAGATTATC TGACCACGGG CCCCAAAGTA 
AAGGAATTTG AAGAAAATCT GGCACGGTAT ACCGGTGCAA AGTATGCTGT TGCCGTGTCC 
AACGGTACTG CGGCACTTCA TGCGGCATGT TTTGCCGCCG GAATAAAAGA GGGGGACGAA 
GTAATCACAA CTCCCATTAC TTTTGCCGCT TCTGCCAACT GCTTGCTGTA TATGGGGGCA 
AAGCCCGTTT TTGCCGATAT TGATCCTGAT ACATACAACA TTGATCCGAA AGAAATCAGG 
GCCAGGATTA CCGAAAAAAC CAAGGCAATA ATACCGGTGC ATTTTACCGG CCAGCCCTGT 
GATATGGATG AAATATTGAA AATTGCAGAA GAATACAATC TTTTGGTGAT AGAGGACGGA 
GCCCATGCCC TCGGAGCGGA ATATAAAGGC AGAAAAATCG GAAGTCTTGG AGATATGACC 
ACCTTTAGTT TTCATCCGGT AAAGCATATT ACGACCGGTG AAGGCGGCGC AATTGTGACA 
AACAGCGAAG AATTGTATAA AAAACTCACT CTTTTCAGGA CGCATGGAAT AACGAGGGAA 
ACGGGAGATT TATTGGAGAA CCATGGCCCG TGGTATTATG AGCAGCAGTA TTTGGGCTAT 
AATTACAGAA TGACCGATAT TCAGGCTGCA TTGGGCATAA GTCAGCTAAA AAAATCCGAT 
AAATTCCTGC AATTAAGAAG AGATTATGCA AAGCTCTACA CTGAAGCTTT TAAGTCCGTT 
GATGAGGTGG TTGTGCCGTA CCAGCTTGAC GGTACAGACT CCTCATGGCA TTTGTATATC 
TTAAAGTTGA AAACGGAAAG GCTTAATTGT GACAGAAAGA AGATATTTGA GGAGCTTAAG 
GAAAGACGGA TAGGAGTAAA TGTCCACTAC ATTCCTGTGT ATTACCATCC GTTTTACAGA 
AAACTGGGAT ATAAAAAAGG TTTGTGTCCT AATGCTGAAG ATTTTTATGA AAGAATAATA 
ACCCTTCCGC TGTTTCCTAA GATGGAAAAG GAAGATATTC TGTATGTAAT TTCCAATGTT 
AAGGACGTAA TTCAAAAACA TATCATATAG

Protein sequence

MEKSAEQKFI PYGCQWIEED DINAVVEVLR GDYLTTGPKV KEFEENLARY TGAKYAVAVS 
NGTAALHAAC FAAGIKEGDE VITTPITFAA SANCLLYMGA KPVFADIDPD TYNIDPKEIR 
ARITEKTKAI IPVHFTGQPC DMDEILKIAE EYNLLVIEDG AHALGAEYKG RKIGSLGDMT 
TFSFHPVKHI TTGEGGAIVT NSEELYKKLT LFRTHGITRE TGDLLENHGP WYYEQQYLGY 
NYRMTDIQAA LGISQLKKSD KFLQLRRDYA KLYTEAFKSV DEVVVPYQLD GTDSSWHLYI 
LKLKTERLNC DRKKIFEELK ERRIGVNVHY IPVYYHPFYR KLGYKKGLCP NAEDFYERII 
TLPLFPKMEK EDILYVISNV KDVIQKHII