Gene Cthe_2762 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2762
Symbol
ID	4810265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3260724
End bp	3262061
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	37%
IMG OID	640108182
Product	transcriptional regulator-like protein
Protein accession	YP_001039154
Protein GI	125975244
COG category	[K] Transcription
COG ID	[COG2378] Predicted transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.763227
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCAGCG ATTTTATAAA ACATTATAAT ATCATAAGGG ACATCCTCAG AGATTGTTTT 
CTTTACGGGT GCTTTTCAAG AGACGGCCTG GAGACAAAAA GAAATGTAAG TTCCAGAAAA 
ATAAGTTATG AGATGCGGCG TATCCAGCAG TACGTCGAAG AGGAATATAT CAAGGTTGAC 
AAGGACGGAA GATACAAGCT TTTAAATCTG ACTTATGATT TTATGCGGCA TTCAGATAAT 
TTCCTTGTGA GCACTTATAT GACCAAAAGC TTCACGCGTA CAGACTTATT GATATATTTT 
CTTATACTTT TGTACATCCA GTCGCAAAAC CGTCAATGTT CCCTAAGTGA GATAGAAGAC 
GGGCTGGTAG AGGGAGGATA TTTGTCTTTT GACAGAATCA GCAGCAAGAC TATTGAAAGA 
AAACTTTCCG AAATGTGCAC AAGCTTTGGA ATCTTAAGCT GCGAAACGGT TAAGAGGAAG 
AAATTTTATT CCATTACGCC CGACATATTA AAAACATTGG ATGATAATGA GTTGAGAGAA 
TTATTTGTGG CTGTGGGGCT TTTTAAAAAT ATAATCTTTC CTGTGGTTGC GGGATATTTT 
TGCGAGCAGA CTCTGAAAGA TTATATGTAT TTTGAAAGAA ATATCAGTGA AAACAATAAC 
CATTGCTTTA GCTACAGGAA TGTGCATTTT CACCCTGTGA TTGAAGAGCA GGTGTTGTGG 
GAGATTTTAA AAGCGATGCA CGAGGAACAT AAAATAAAAA TTATTTATCA TTTACCTCAT 
AAAAATCAAG AAAAAAGTTC TAAAACCCAA GGATATGCTG CAAACGGTGA TTGCAAGCGT 
CAGTGCAGCA AAACTTTGGC TCCATATAAA ATAAGATATG ACGTCCGATA TGGAAGGTTT 
TATCTGGTGT CCTTTGATGG CAGTAAAAAT TGCATAGTAT CAAGGCTTGA CAGAATAGAG 
AGTGTGGAAA TATTGGAAGA TACTTTCCGA AGAAAAGACT ATGATGAATT ATATGATAAA 
CAGATGAGAT ACAGTTGGTC CAGTATGCCT CTTAAACAAA GAAAAGAACC GGAAAAAGTA 
AAACTTGAGG TTATTATTGA TGAAGAAACA GAAGGATATA TAATTGAAAA AATTTTAAAT 
GAATCACCCA ACGGGACAGT AGAAAAAATT GAAGACGGGC GGTATCATGT AACAATTGAA 
GTCAACGACA GCGGGGAGCT TATTCCCTGG ATCAGAGGGT ATGCAGGATA TGTCAGAGTT 
TTGGAAAGCA AGGAACTGGC AGAGAAAATT TTTAGTGACT GGAAGGAGAT GCTTTCATCC 
TATGGAGTTG TTCAGTGA

Protein sequence

MFSDFIKHYN IIRDILRDCF LYGCFSRDGL ETKRNVSSRK ISYEMRRIQQ YVEEEYIKVD 
KDGRYKLLNL TYDFMRHSDN FLVSTYMTKS FTRTDLLIYF LILLYIQSQN RQCSLSEIED 
GLVEGGYLSF DRISSKTIER KLSEMCTSFG ILSCETVKRK KFYSITPDIL KTLDDNELRE 
LFVAVGLFKN IIFPVVAGYF CEQTLKDYMY FERNISENNN HCFSYRNVHF HPVIEEQVLW 
EILKAMHEEH KIKIIYHLPH KNQEKSSKTQ GYAANGDCKR QCSKTLAPYK IRYDVRYGRF 
YLVSFDGSKN CIVSRLDRIE SVEILEDTFR RKDYDELYDK QMRYSWSSMP LKQRKEPEKV 
KLEVIIDEET EGYIIEKILN ESPNGTVEKI EDGRYHVTIE VNDSGELIPW IRGYAGYVRV 
LESKELAEKI FSDWKEMLSS YGVVQ