Gene Cthe_2637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2637
Symbol
ID	4808948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	3118798
End bp	3119835
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	40%
IMG OID	640108050
Product	glycosyl transferase, group 1
Protein accession	YP_001039029
Protein GI	125975119
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGCA GGGGCCATAA TACAATTTTT GCGTCCAGCG GAGGAGTTCT TGCAGAAGAA 
ATAAAAAAAG AATTCAGGCA CATTGACATA CCCACACTGG CAGTAAATAA AAGGGACCTT 
ATCTCAACAA TAAAAAACAT CATAAAGATA AGAAAAATAC TCAGGGAAGA AAATATAGAC 
ATTATACACG GCCACAATGC CGCAGCGGCA TTTACCGCAT ATCTGGCGTC AAAAACCATA 
AACAGGAAAG TGGCAATCAC CCATAGTGTC AGAGGAATGG AAATCCGGAA AGGCTATCAG 
TGGAGGAACT TTATATACAG ACTTTATCCC GCCACTTTTT TTGCCGTGTC CGATTTTACC 
AGACAAATGC TGATTAAAGC GGGTGTAAAA GAGAACAGAA TTATAAATAC CTATAATGGA 
GTGGATATTG GGAAATTTGA CGTGTCAAAA TGGAACAAAA ACGCTTTCAG AGACGAAATT 
GGCGTTTCAA AAGACACTGT TCTTGTCGGT ACTGTGGGAA GAGTCAATTA CAACAAGGGG 
CAGGAAGTTC TTATAAAAGC TATCCCACAT ATTCTTAAGA AAACATCAAA TTTCAAAGTC 
GTAATAGTCG GAGACGGAGA GAAGCTGGAA GCTTGCAAAA CACTTGCAAA AGATTTGGGC 
GTGGAGGAAT TTGTGCATTT TACCGGATTC AGAAGAGACA TACCCAATAT TCAGGCAGCC 
CTGGACATAT ATACTCTTGC TTCGGTTAAA GGTGAAATGT TTCCAAATTC CATACTTGAA 
GCAATGGCCA TGGGAAATCC CTGGGTTGCC AGCAACCTCA GCGGTATCCC GGAAATATCG 
GAAAACGGCA GAAATGGATT TTTGTCAGAG CCGAACAACT GCGAAGATCT TGCGGACAAA 
TTAAGTAAAT TGATTATGAA TGAAAGCTTA AGAAAAGAAA TGGGTGAAAA CTGCATTAAA 
ACCATTTACG AAAAGTACAC CATAGAAAAA GTATGCGATG CGATAGAATA CGGATATCTG 
AGTGCTTTAG AACAATAA

Protein sequence

MKRRGHNTIF ASSGGVLAEE IKKEFRHIDI PTLAVNKRDL ISTIKNIIKI RKILREENID 
IIHGHNAAAA FTAYLASKTI NRKVAITHSV RGMEIRKGYQ WRNFIYRLYP ATFFAVSDFT 
RQMLIKAGVK ENRIINTYNG VDIGKFDVSK WNKNAFRDEI GVSKDTVLVG TVGRVNYNKG 
QEVLIKAIPH ILKKTSNFKV VIVGDGEKLE ACKTLAKDLG VEEFVHFTGF RRDIPNIQAA 
LDIYTLASVK GEMFPNSILE AMAMGNPWVA SNLSGIPEIS ENGRNGFLSE PNNCEDLADK 
LSKLIMNESL RKEMGENCIK TIYEKYTIEK VCDAIEYGYL SALEQ