Gene Cthe_2336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2336
Symbol
ID	4809264
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2785043
End bp	2786170
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	37%
IMG OID	640107743
Product	glycosyl transferase, group 1
Protein accession	YP_001038731
Protein GI	125974821
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000420527
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATTA TGTATGTGAT TGATGCCGGT CCGGTTAACG GTGGTGCACC GATTTCCACT 
TCAATATTGG CCAATCAGTT TGCGGGTGAT GATAATGAGG TTATTATGGT CATGCCTAAA 
AATAAAGATA CTGAGATTTT GGATAAAAGA ATAAAGAGGA TTGAACTTGC ACGGTTTTCT 
GACTATTTTC CTCTTGATGT TTTTCATCCA ATAAAAGCTT TGCTTCTTGC AAAAGATTTG 
AAAGCAGTCA TTGAAAAGGA AAAACCCGAT GTTATACATG CAAATATGCC TCGCGGAGCA 
AGAGCAATTG GGTTATTGAA ATTGCTTGGA ATGATATCTG ATAAAATAAA GCTTGTTTAC 
ACAGACAGGG AGCATATTTC ACAATTCAGT CCCCTGGTAC GGATGCTGTA TATTTTCTTT 
ATTGCAAGAA GATATGATGC TATAATATGT ATCACGGAGA AGAGCATGGA ATACTGGAGA 
AAAAAAGCGA GGAAAGCCAA GATAAGTGTA GTACCCAATA CAGCGGGAAA ATATTATGAG 
ACTTATGAAC CTGATATGCA TTCTATAGTC CGAAAAAAGC TAATGATTCC TGACAAAAAA 
TTGACGTTAA TGTTTGCCGG AAGAATGATT GAAGCAAAGA ACTGGCCATT GGCTAAAGAA 
ATTGTGAGCA AACTGTCTAA GGAGGATGTT CACATTATCA TTGCAATTTC GTACTTTAAT 
CAGGAGCAAG AGTGTAAGAC AAAAGACTTT CTGGAAAGTA TCCGAAGGCT TGGTGTGAGT 
TACACCTTTA AAGAGAATAT TCCGCAAGAA GAAATGAATG AACTGTATTA TGCGGCCGAT 
ATTTTTGTTT TAACTTCAAA CAGGGAATCT TTTGGCAGAA CAGCAATAGA AGCAATGAGC 
AGAAAATGTG CTGTTTTGGG GCGTAATGTT GGAGGACTTC CCGAGGTAAT ACAAAAAGAG 
GCAAACATAT TTGATTGTGA TGCCGACAAA TTTGTAAACC GTATATTGGA GTACAAAAAA 
AACACGGAGG AATTGGAGAA AGACAAAGAT TGGTTTTATG AGCGTTTTGC AAATAATTAT 
ACGGCTGAAA TATATAAAAG AAAACACGAA GATGTTTACC GGTTTTAA

Protein sequence

MKIMYVIDAG PVNGGAPIST SILANQFAGD DNEVIMVMPK NKDTEILDKR IKRIELARFS 
DYFPLDVFHP IKALLLAKDL KAVIEKEKPD VIHANMPRGA RAIGLLKLLG MISDKIKLVY 
TDREHISQFS PLVRMLYIFF IARRYDAIIC ITEKSMEYWR KKARKAKISV VPNTAGKYYE 
TYEPDMHSIV RKKLMIPDKK LTLMFAGRMI EAKNWPLAKE IVSKLSKEDV HIIIAISYFN 
QEQECKTKDF LESIRRLGVS YTFKENIPQE EMNELYYAAD IFVLTSNRES FGRTAIEAMS 
RKCAVLGRNV GGLPEVIQKE ANIFDCDADK FVNRILEYKK NTEELEKDKD WFYERFANNY 
TAEIYKRKHE DVYRF