Gene Cthe_2808 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2808
Symbol
ID	4809645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3309546
End bp	3310583
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	40%
IMG OID	640108228
Product	LacI family transcription regulator
Protein accession	YP_001039200
Protein GI	125975290
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0294888
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAGTG AAGAAATAGC AAAATTATGT GGTGTTTCCA GAGCCACGGT ATCCAGGGTT 
ATTAACAACA GTCCCAACGT AAAAGAGGAA ACGCGGCAAA AGATTCTGGC AGTGATAAAA 
GAAAAAAATT ATGTTCCGAT AGCGCCGGCA CGGCGTTTGG CCGGGATAGA CAGCAATATA 
ATTGGCCTGT TTGTTTTGGA TATTGACATA TCTGAGTCAA AGTCAAGGGT CTCGGAAAGT 
ACATACTTTT CACGGCTGAT AAATCTGATA ATAGACCAGG CAAACAATTT TGGCTTTCAA 
GTATTGGTGT CAATTATAAC TTCACAGAAA CAGCTGAGTG AAATTAGAAA TCTCTTCATG 
AGCAGAACCA TTTTCAGCGG CATTTTTATC GGTGCGTTCA ATGATGAAAT CCAACTTGAT 
GATGATATTA TAATGCAACA TCCCACAATT ATTATTGACC GCCAATCAGA AAGGATGGTG 
AAAAAGCCAA ACAGATTGGT TGTAAACCTG GACAACTTTG AGGGTGCTTA TAATGCGACA 
CAGTTTTTGA TTAAATTGGG GCATACCAGA ATTGGGCACA TATCCGGGGA CCTTAGAAAA 
CTTTCGGGCA TAGAACGCTA TGAAGGATAC AAAAAAGCAT TGGAAGATGC AGGATTAGGT 
TTTGACAAAA ATTTGGTTCG TGAAGGGAAC TTCCTTGATG ACAGCGGCTA TAGGCTTGCA 
CGTGAGATAT TAAAAGAGAA CGTGACGGCT ATTTTCTGTG CCAATGATGT AATGGCAATT 
AGTGCAATTA AAGCCATAAA AGAAACGGGT TTGAGTGTAC CGGATGATAT ATCTGTAATA 
GGCTTTGATA ATACAGCAAT CGGAAATTAT ATCATGCCTG CATTGACAAC TGTGAACGCG 
CCGTTGGAGC ATATTGCAGA AGCATGTATT GAGTCATTGA AATACTTTTG CGAGCACAAA 
CATTTTAAAC AAAAGGAAAT CAGGGTTAAA ACCGATTTGA TAATCCGGGA TTCAACCAAG 
AGGGCTTTGG AATTCTGA

Protein sequence

MTSEEIAKLC GVSRATVSRV INNSPNVKEE TRQKILAVIK EKNYVPIAPA RRLAGIDSNI 
IGLFVLDIDI SESKSRVSES TYFSRLINLI IDQANNFGFQ VLVSIITSQK QLSEIRNLFM 
SRTIFSGIFI GAFNDEIQLD DDIIMQHPTI IIDRQSERMV KKPNRLVVNL DNFEGAYNAT 
QFLIKLGHTR IGHISGDLRK LSGIERYEGY KKALEDAGLG FDKNLVREGN FLDDSGYRLA 
REILKENVTA IFCANDVMAI SAIKAIKETG LSVPDDISVI GFDNTAIGNY IMPALTTVNA 
PLEHIAEACI ESLKYFCEHK HFKQKEIRVK TDLIIRDSTK RALEF