Gene Cthe_1861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1861
Symbol
ID	4809412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2205977
End bp	2207062
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	36%
IMG OID	640107280
Product	CdaR family transcriptional regulator
Protein accession	YP_001038275
Protein GI	125974365
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3835] Sugar diacid utilization regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0198483
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGTAA AGATATATCA GAATCTTGTA AATCAAATAA AGGACGTAAT AGATTCGGAG 
TTTGGGATAA TGGATGACAC AGGTCTTATT TTGGCCTGCT CAGATGAAAA GAAAGTGGGA 
CAGAGCAGTT CACTGGTATC TGAGATAATG AGGTCCAAAG ATCAGTTTGT GGTGATTGAC 
GGACAAACGT TTCAGAAGGT ATACATAAAG AACAAACTTG AATTTATTAC GTTTATTGAT 
TCGGATTCTG AAAACAGCCA AAAATTTCTT GCGTTGATAT CGATTAATAC CATTAACGTA 
AAGAATTATT TTGACGAGAA ATATGATAAG ATCAGTTTTA TAAAAGGAAT TATAATGGAT 
AATATTCTTC CAGGAGATAT CACTTTGAGG GCAAAGGAGT TGCACCTTCA AAATAATGTA 
AACAGAGTGG TTTTTCTTGT GGAAACCGAA AAGGCAAAAG ATATTTATGC CCACGAGATA 
ATTGAAGGGC TTTTTCCGGT TAAAAACAAA GACTTTGTTG TAGTGCTTGA CGATGAGAAA 
GTTGTGCTTA TAAAAGAGTT GAAGCCGGAC TATGACTACA AGGAGATAAA CAAAATTTCC 
AAAGTTATTA TTGATACTTT GTCCACGGAG GGAATGATTA AAGCCAGGGT TGGAATCGGC 
ACGGTTGTTG ACAATATAAA GGATATAGGA CGTTCTTTCA AAGAAGCACA GATGGCGCTG 
CTTATAGGAG GCATTTTTGA CAGCGAAAAG AGTATTGTGG ATTACAACAG ACTTGGGATA 
GGAAGGCTCA TATATCAGCT TCCTCCGACA TTGTGCAAGC TGTTTTTAAA AGAGGTGTTC 
AAGGAAGGCT CCTTTGAAGC TTTGGATTCC GAGACGATGT ATACGATTAA CAAATTTTTT 
GAAAACAATC TTAATGTAAG TGAAACTTCA AGGCAGCTTT ATGTTCATCG AAACACCCTT 
GTGTACAGAC TGGATAAGAT TCAAAAAATT ACAGGCCTTG ACCTTAGATT GTTTGACGAT 
GCAATAATAT TCAAAGTTGC CATGCTGGTA AAAAAATATC TTGACAGTAA TCAAGCCCTT 
GTATAG

Protein sequence

MSVKIYQNLV NQIKDVIDSE FGIMDDTGLI LACSDEKKVG QSSSLVSEIM RSKDQFVVID 
GQTFQKVYIK NKLEFITFID SDSENSQKFL ALISINTINV KNYFDEKYDK ISFIKGIIMD 
NILPGDITLR AKELHLQNNV NRVVFLVETE KAKDIYAHEI IEGLFPVKNK DFVVVLDDEK 
VVLIKELKPD YDYKEINKIS KVIIDTLSTE GMIKARVGIG TVVDNIKDIG RSFKEAQMAL 
LIGGIFDSEK SIVDYNRLGI GRLIYQLPPT LCKLFLKEVF KEGSFEALDS ETMYTINKFF 
ENNLNVSETS RQLYVHRNTL VYRLDKIQKI TGLDLRLFDD AIIFKVAMLV KKYLDSNQAL 
V