Gene Cthe_0286 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0286
Symbol
ID	4808504
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	353826
End bp	355100
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	39%
IMG OID	640105698
Product	response regulator receiver sensor signal transduction histidine kinase
Protein accession	YP_001036718
Protein GI	125972808
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase [COG3437] Response regulator containing a CheY-like receiver domain and an HD-GYP domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.136894
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGAAC CGGTATACAC AATTCTGATT GTAGATGACA ACGAAAATAA TTTGTTTTCT 
TTGAGAACTC TTATCGAAGA ACATATAAAT GCAGATGTAA AAGAAGCTAA TTCGGGAGAA 
AAGGCATTAA AAATTTTGTT TAAAGAGAGA GTGGATCTTA TCATTCTTGA TATTCAAATG 
GAAGGAATGG ACGGCTTTGA GCTCGCTTCG ATAATAAAAA AGAGAAAAAA GACAAGCAGT 
ATACCTATAG TTTTTCTGAC TGCTTCCTAT ATCGGTGACG AGTTTCAAAG AAGAGGATTT 
GAGATTGGTG CTGTGGATTA CCTGACAAAG CCTATTGACG AATACCAGCT TATTAACAGA 
ATTAATGTCT ACCTGAAAAT GATAGAAAAA GAAAGGACTA TGAACATACT TCTTGAAAAA 
AGGGTAAGGG AGCAGACAGA AGAATTAAGG GCTGCAAAAG AAGCAGCAGA AGCGGCGAAT 
GAAGCCAAAA GCATTTTTCT TGCCAATATA TCTCATGAGC TTAGGACTCC CATCAACATC 
CTGTACAGCA CAACACAGAT AATTAATTCA TATCTCAATG AGGACAAGGT TCTTGACAGA 
GAAAAAATTC GAAGTAAGAT AGCCATGCAG CAGCAAAACT GCTATCGTCT GTTGAGGCTT 
GTCAACAATC TCATTGACAT TACCAAAATA GATTCAGGTT ATTTTGAACT TAAATTCTCT 
CGTTGCAATA TAGTTGAAGT GGTTGAAAAT ATTACTTTAT TGGTTGTGGA ATATGCCAAA 
AACAAAGGGG TCTCCCTCAT ATTTGACACC GATGTGGAAG AAAAGATCAT TTCCTGCGAC 
CAGAATGCAA TGGAGCGAAT AATATTAAAC CTTTTGTCCA ATGCGATAAA ATTCACGCCG 
AGGGGAGGAT CTATAAAGGT TGAGGTGAAA GACTGCGGCA AGACTGTTGC AATAAGTGTG 
AAAGATACCG GAATAGGAAT CCAGGAGGAT AAACTGGAAA TGATTTTTGA AAGGTTCAAG 
CAGGTGGATA ACCTTTTGAC CAGAAAAAAT GAGGGAAGCG GTATTGGTTT GAGCCTGGTC 
AAATCACTGG TGGAACTGCA CGGCGGAAAG ATCAGTGTAA AGAGTGAGTA CAACAGGGGA 
AGCGAGTTTA CGGTTGAACT TCCCGCGGAT CTGGAAAACG GGGAAAATCC TTCAATGGAT 
GCGGCGGACA GAAAAGAAGA AAACGAAAAC AAGCAGCACA ATGTGCATAT AGAATTTTCT 
GATATATACT ATTGA

Protein sequence

MQEPVYTILI VDDNENNLFS LRTLIEEHIN ADVKEANSGE KALKILFKER VDLIILDIQM 
EGMDGFELAS IIKKRKKTSS IPIVFLTASY IGDEFQRRGF EIGAVDYLTK PIDEYQLINR 
INVYLKMIEK ERTMNILLEK RVREQTEELR AAKEAAEAAN EAKSIFLANI SHELRTPINI 
LYSTTQIINS YLNEDKVLDR EKIRSKIAMQ QQNCYRLLRL VNNLIDITKI DSGYFELKFS 
RCNIVEVVEN ITLLVVEYAK NKGVSLIFDT DVEEKIISCD QNAMERIILN LLSNAIKFTP 
RGGSIKVEVK DCGKTVAISV KDTGIGIQED KLEMIFERFK QVDNLLTRKN EGSGIGLSLV 
KSLVELHGGK ISVKSEYNRG SEFTVELPAD LENGENPSMD AADRKEENEN KQHNVHIEFS 
DIYY