Gene Cthe_2944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2944
Symbol
ID	4810227
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3459183
End bp	3460997
Gene Length	1815 bp
Protein Length	604 aa
Translation table	11
GC content	40%
IMG OID	640108367
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_001039335
Protein GI	125975425
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTTTTG GACGCAAAAA GGGAATGCCC GAAGTGATAA AGGGACTTGA AGAGGAAAAA 
ATCAGCACGT CATGGAAATT AAACCTTGAA TTTGCGCTAA TAGTTATGTT TTCCATATTT 
GTGGTAGGTG CAGCCTCGTT TGGTATGATT TCGAACTTTA TATTAAATCA TGCAAAGGTC 
AGTTCCAGCG AGCTTATCAA GCAAACATCC AAAAACATTG AAGCTATTCT GACAGGTTTT 
GATGAACTGG CGATGACTGT GTCAAGGGAT AACACACTGG CAGAGTATAT AAGTGTGCAC 
GACAGTATAG AGGATGTTAA TCTTAAGGCT CAAAATGAAA GAAAAATCAA GGAAATCCTG 
AATAATTACG CAAAAAAAAG AAAAGACATA ACCAATATTG CAGTGGTATC AAACGGGGGA 
ACTTACATAA CACCAGATGA GACAAAACCG GGCATTGATA AAAATATAGA TGACATTTAT 
GCGGTAAAAG CGTTTAAAGA AAGCCACAGG CAGTCATTAT GGCTCAACAC GTATACATTG 
GACACTTCAC CCTCCGAAAA TGTACAGGTC TTTTCAATAA TAAAGGGGAT ATATTCTTTA 
AGCAGTCTGA AAAGCCAGGG AATCTTGATT ATAAACATTA CGGAAGACTA TCTTTTCAGA 
CTTATATCGG ATATTAAGCC CATTGACGAC GGAAGAATCT ATATAATCGG CAGTGACGGG 
AATTACGTTT TAAACCCCTA TGACAGAAGC AAGAACGGTA AAAAGGCGGA TCTTGAGTTT 
GTGGAGGACA TGCTGCGCAA GGGCGAGAAT GTGGACATAA AGGAAATAAA TGGTGAGGAG 
TATCTTGTGA CTTACAATAC CATTCAGGAG ATAAAAGGTA CCGGGCTGGG ATGGATGATA 
GTCGAGATTA CTCCGGTTTC GGTGATCAGA ACCAGTGTTA CCGAAGCGGG AATGCGCCTG 
TTTTTCATAG GTTTTGGGTG TGTTGTCCTG GGATTGATTC TTGTAGGGAT GGCAACCGCT 
TTTTACAACC GATATCTCAA TAAAAGCTAT TGGGAAAGGC ATTCCGTTGC ATTGGAAAGG 
GAGAGACTTG CTTCCTTGGG ACAACTGATA GGGGGAATTG CACACAATTT CAAAACTCCA 
ATTATGTCAA TAGCCGGAGG ACTGGAGGCA TTAAAAGATC TTGTGGATGA GTACGACATT 
TCCATCGGAG ATCCGCAGGT AACCGGTGAG GATCATCATG AAATTGCTGC TGAAATGAGA 
GATTGGATAA GCAAAATAAA GCCTTACTGC GGGTATATGT CGGAGATTAT ATCCACGGTA 
AAAGGGCAGG CCGACAATAT GAATGGATCA GAGAATTCAA GCTTTACGGT GGGAGAACTT 
TTAAAAAGAG TTGAAATTTT AATGAGCCAC GAGCTTAAAA AATTTTCCTG CGAGCTGAGA 
TTGGATATAA AAGTGGATGA GGATACAACT ATAAAAGGAG AAATAAACAA CCTTGTACAG 
GTATTGAACA ACCTTATATC CAATTCTATC GAGTCTTACA ACGGAAAGGA AGGAAAAATA 
GACCTGTCAG TAAGCAAAAA TGGCCAGGAA TTGGAAATAG TTGTAAAAGA CTATGGATGC 
GGCATACCGG AAAATGTAAA GAGGAAACTT CTGAAAGAAA TGATAACGAC CAAGGGAAAA 
AACGGAACAG GACTTGGCCT TTATATGTCT CACTCCACGA TTAAGGGCAA ATTTGGCGGA 
ACAATGAAAG TCAAGAGTGA GGAAGGAAAA GGGACGGAAA TATGCATTTT GATTCCTTTT 
GCTGCCAAAA CTTAA

Protein sequence

MLFGRKKGMP EVIKGLEEEK ISTSWKLNLE FALIVMFSIF VVGAASFGMI SNFILNHAKV 
SSSELIKQTS KNIEAILTGF DELAMTVSRD NTLAEYISVH DSIEDVNLKA QNERKIKEIL 
NNYAKKRKDI TNIAVVSNGG TYITPDETKP GIDKNIDDIY AVKAFKESHR QSLWLNTYTL 
DTSPSENVQV FSIIKGIYSL SSLKSQGILI INITEDYLFR LISDIKPIDD GRIYIIGSDG 
NYVLNPYDRS KNGKKADLEF VEDMLRKGEN VDIKEINGEE YLVTYNTIQE IKGTGLGWMI 
VEITPVSVIR TSVTEAGMRL FFIGFGCVVL GLILVGMATA FYNRYLNKSY WERHSVALER 
ERLASLGQLI GGIAHNFKTP IMSIAGGLEA LKDLVDEYDI SIGDPQVTGE DHHEIAAEMR 
DWISKIKPYC GYMSEIISTV KGQADNMNGS ENSSFTVGEL LKRVEILMSH ELKKFSCELR 
LDIKVDEDTT IKGEINNLVQ VLNNLISNSI ESYNGKEGKI DLSVSKNGQE LEIVVKDYGC 
GIPENVKRKL LKEMITTKGK NGTGLGLYMS HSTIKGKFGG TMKVKSEEGK GTEICILIPF 
AAKT