Gene Cthe_1357 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1357
Symbol
ID	4809352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1650663
End bp	1651757
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	32%
IMG OID	640106781
Product	glycosyl transferase, group 1
Protein accession	YP_001037782
Protein GI	125973872
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTGGAG CAGAAAGAGT AATGGCAACA CTGGCTAATG AGTTTGTTAA GCGTGGGCAT 
CAAGTTAGAT TAGTAACATT AAAAAAAGCT GTCTCTGCAT ATGAATTAGA CAAGCGTGTA 
GAATTTATAG GCGGAGGAGC TGATATAAAT TCTGGTAATT TTTTGATAAA AAGAATTCAA 
ATGATAAGTG CGGTTATTAA AGGTACATTG TTTTATAGAC GTCAATTGAG AGAATATAAA 
CCAGATATAA TTTTATCGTT TCTAACTTAT ACAAATTTAT TATCAGTAAT AAATAATAGA 
ATTTCACGGG TTAAATATCC TGTTGTTGTT TCTGAACGTT GTGACCCTAG AAAAAGAAGC 
AAGTTACTTA TTAAATTATG CAACATTGTG TACCCGCTAG CTGATTGCAT TGTTTGTCAG 
AGTAAAGTAA TACAAGATTA TTTTTTGAAC AAAAATCCTA AATCAGTTAC AAAAGTAATT 
CCAAATCCAG TTAATGAAGA ATGTATTAAT AAAGAAGAAA TAATAAAAAG GAGAAAGCTG 
ATTGTTGCAG TTGGAAGACT GAGTAATCAA AAAAATTACG ATTTACTCAT AGATGCATTT 
TCTGATATTG CCAACGAATA CTCTGAATAC AGGCTTGAGA TTTATGGAGA AGGACCTGAA 
AGGGAAAGAC TTCAGAAAAA AATTAACCGT TTGGGCTTGA ATGATAGAAT TCAATTAATG 
GGAACTAAAA CAAATGTTAT GAAGCACATA GCAGATGCAC AACTTTTTGT TATGTCTTCG 
AATTTTGAAG GATTCCCTAA TGCTTTAGCA GAAGCGATGG CTTCAGGGCT CCCTGTTATT 
TCTACAAACT TTCCATCGGG AGTGGCAAAA GAACTTATTA TTGATGGTGA AAATGGATAT 
GTTGTTGATA TTAACAATAG AGAGCAGATG GCAGATGCAA TGCGAAAGAT ACTGGGGGAC 
CCACTGACAA TTACTAAAAT GAGCAAAAAT AACGTATTAC TTAGGGAAAA ATTGAATGTT 
AAGACAGTTG CAAATATGTG GGAAAATTTA TTTAATGACA TATTAGAAAA GAGGACTAAA 
AATGAAAAAA ATTAA

Protein sequence

MGGAERVMAT LANEFVKRGH QVRLVTLKKA VSAYELDKRV EFIGGGADIN SGNFLIKRIQ 
MISAVIKGTL FYRRQLREYK PDIILSFLTY TNLLSVINNR ISRVKYPVVV SERCDPRKRS 
KLLIKLCNIV YPLADCIVCQ SKVIQDYFLN KNPKSVTKVI PNPVNEECIN KEEIIKRRKL 
IVAVGRLSNQ KNYDLLIDAF SDIANEYSEY RLEIYGEGPE RERLQKKINR LGLNDRIQLM 
GTKTNVMKHI ADAQLFVMSS NFEGFPNALA EAMASGLPVI STNFPSGVAK ELIIDGENGY 
VVDINNREQM ADAMRKILGD PLTITKMSKN NVLLREKLNV KTVANMWENL FNDILEKRTK 
NEKN