Gene Cthe_0800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0800
Symbol
ID	4810418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	966908
End bp	968119
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	34%
IMG OID	640106217
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_001037228
Protein GI	125973318
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTAAAA AGCTTAAAAT AAAATTTGTC ATGACCAATA TTGTCAGCAT AACAACCATT 
CTGGTTATTA TTTTTTTTGG TATATATTTG TCAGTAAAGG CGTTTTTGAA ACTTCAGGCC 
GATATAATAC TGTACACCAT TGCAAATGAA GAAAAACTAA ATTCAAATTT TGATTCCGGA 
TTTGTAAGAT TCTTTTCTAT AAAAATAGAC ACATCAGGAA AAATTATCGG GTATCTGATG 
AATATCAACA TTTCCAGTGA AGAAATGGAA ACACTCAAAG AAAAAGTAAT AGAAAAAGGA 
GAAACAAGAG GAAAAATTTC AAATGACAAG TTCAAATTTA AATTTTTGAA AATTCCCAAG 
GAATATGGAT ATATAATTGT ATTTCTTGAT TACACTGTAG AAGAAAAAAT GTACAAACCA 
CTCATTATCA TAAGTATCTA TATTGTTCTA TTGTCCATAG TACTGGTTTT TACAGTAAGT 
TTTTTCCTTG CAAACAGATC CATAAAACCA ATAAAAACCT CCTGGGAAAA GCAGACTGCT 
TTTATTGCTG ACGCATCCCA TGAACTCAGG ACACCTCTCG CAGTAATAAA TTCCAACCTG 
GAAATAGTGA TGGAAAACGA AAATGAAACT GTCGGAAGTC AAATGAAGTG GCTTGGTAAC 
ATCCAAAGCG AATTGGAGCG CATGAAAAAA CTTGTTGACG ATTTATTGTT TCTGGCAAGA 
GCGGATGCTG AAGATGAAAT GCCTAAGGAA TATTTTGATT TAAGCAGGCT TGTACACAAA 
ATTTATGACG AGTTTACACC CCTTTGCCAA AAGAAAAGCT TGGAATTTTT ATTGGACGCT 
AAAGACAATA TTGTGTTTTA CGGCAACGAA TTTCGCATAA AACAGCTCAT AACAATATTA 
TTGGACAATG CAATAAAGTT CACGGGTGAA GGAGGAAAAA TCATACTTAA GTTAAAAGTG 
CATGCAAACA GTATTCAATT GTCTGTCAGC GATACAGGAG AAGGCATTGC CAAAGAACAT 
ATTGACAAAA TTTTTGACAG ATTTTACAGG GTGGACAAAT CCCGTTCACG AAACCACGGA 
GGCTCGGGAT TGGGCTTGGC CATTGCCAAA TGCATAGTAA ATGAACATAA AGGCACCATC 
GATGTTTTCA GTGAAGTGTC CAGAGGAACG GAATTTACAG TATCTTTGCC ATATAAAGCA 
TCCCAGTGTT AA

Protein sequence

MFKKLKIKFV MTNIVSITTI LVIIFFGIYL SVKAFLKLQA DIILYTIANE EKLNSNFDSG 
FVRFFSIKID TSGKIIGYLM NINISSEEME TLKEKVIEKG ETRGKISNDK FKFKFLKIPK 
EYGYIIVFLD YTVEEKMYKP LIIISIYIVL LSIVLVFTVS FFLANRSIKP IKTSWEKQTA 
FIADASHELR TPLAVINSNL EIVMENENET VGSQMKWLGN IQSELERMKK LVDDLLFLAR 
ADAEDEMPKE YFDLSRLVHK IYDEFTPLCQ KKSLEFLLDA KDNIVFYGNE FRIKQLITIL 
LDNAIKFTGE GGKIILKLKV HANSIQLSVS DTGEGIAKEH IDKIFDRFYR VDKSRSRNHG 
GSGLGLAIAK CIVNEHKGTI DVFSEVSRGT EFTVSLPYKA SQC