Gene Cthe_1244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1244
Symbol
ID	4809749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	1507662
End bp	1508834
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	35%
IMG OID	640106667
Product	glycosyl transferase family protein
Protein accession	YP_001037669
Protein GI	125973759
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAA AGTATGGTGA GCAAAAATTG AATAAAGAGT TAGTTTCAGT AAGCATATGC 
GTTTACAATG GCGAAAAATA TATAGAATCT TCTATAAAAA GCGCCCTTGC GCAAACATAT 
CAAAACATAG AAATAATAGT AATTGATGAT GGTTCGACGG ACAGGACGGG CGAGATTGTA 
AAAAACTATT GTCCCGATGT TAAATATATC TATCAAGAGA ATAAAGGTGT GTCAGAAGCC 
AGGAATACAG GACTTAGGCA CTGCAGCGGA AATTATATTG CATGGTTGGA TGCCGATGAC 
TTATATTTAC CGGATAAAAT AAAAGAACAG GTTGATTTTT TACAACAGAA TAAAGATATA 
GACTGTGTAT ACAATGACGC TTTTTTAATC GATGCTCACG ACAACTTGGT TAAAGTGCTT 
AGAAGCGATT ATGGCAATTT GGCTCCAAAT GATTTTTTGG CACAGCTTCT TTTCAGACAA 
ACCATTCCCT GTCCGCCAAG TACCTTGTAT AGAAGAAAGT GTTTTGAAAA CCTGCGTTTT 
ATTCCCGGCA TGAGGTATGC GGAAGATTAT TGGAGCAGCA TCCAACTGGC CCAAAGATTC 
AAATGTGGAT ATTTGCCTAA AATCCTCTAC AAATACAGAA GGCATGACTC CAACCTGACC 
AATAACAAAG AAAAACAAGA AGAAATGGAA ATCAAAGTAG TTAAAAGTCT TGGAATTGAT 
AAAATAAAAG ATATCGTAGA AAAGTCTTCT TATCCTGAGC ATGAAAAGCT TTTATTGCTT 
GGTAAAATTT TTATCAAAAT CAGTGAATAC GAGGAAGCAT GTAAAGCCTT GGAAAAAATC 
CAAGTCCCGG ACTATATTCA GGACAGAAAA ACGAAATTTT TAAAATACTT TTACCTGGGA 
AATGTAAACT ATTTGACAAA AGAATATAAC AAAGCAAAAT TTTGCTACGA AAAATCGCTC 
CGAACAGACC CCGGCAAAGC AGAAGCATAT AACAATTTGG GTGCGGCATT ATATCACTTG 
TCAGAAACTG AGGAAGCACT TGAAAATTTT AATAAAGCAC TCGCTTTGAA AAAAGAATAT 
CTCGACCCTC AGAACAACTT AAAAAATATA AAAACAGGCG GGGATTTAAA AATTACAATC 
CGGGAGTTGA GAGAAAATTT GATGGTTTAT TAG

Protein sequence

MKRKYGEQKL NKELVSVSIC VYNGEKYIES SIKSALAQTY QNIEIIVIDD GSTDRTGEIV 
KNYCPDVKYI YQENKGVSEA RNTGLRHCSG NYIAWLDADD LYLPDKIKEQ VDFLQQNKDI 
DCVYNDAFLI DAHDNLVKVL RSDYGNLAPN DFLAQLLFRQ TIPCPPSTLY RRKCFENLRF 
IPGMRYAEDY WSSIQLAQRF KCGYLPKILY KYRRHDSNLT NNKEKQEEME IKVVKSLGID 
KIKDIVEKSS YPEHEKLLLL GKIFIKISEY EEACKALEKI QVPDYIQDRK TKFLKYFYLG 
NVNYLTKEYN KAKFCYEKSL RTDPGKAEAY NNLGAALYHL SETEEALENF NKALALKKEY 
LDPQNNLKNI KTGGDLKITI RELRENLMVY