Gene Cthe_1268 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1268
Symbol
ID	4809773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1541610
End bp	1542788
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	39%
IMG OID	640106691
Product	histidine kinase
Protein accession	YP_001037693
Protein GI	125973783
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCGGTT ATAAAAAAGT AGACACAGCT AATTTGGATA AAATAATTAA GAAAACAATT 
GAAGCCATAA ATAACAGTAA AGCCGAATTG TTTGACATAG CCGAAAACGC GAGAAATGAA 
TGCGTAAGGC TTGAAAAAGA ACTGGAGGAG TTAAAGCGCA GGACATCCGA AATTATCAAA 
AGTGTGGAAA CCCTTGAGGT TGCACTTTAT GAAAGCAAGA AACGGCTAAT GCATGTGAGC 
AGAAATTACG ATAAATATTC TGAAGAGGAA TTAAGGGAAG CTTATGAAAA TGCAGACAAT 
ATCAGGGTTG AGCTTGCCAT AAAACGGGAG CGTGAGCAAT ACTATATCAA AAGAAGAAAT 
GAATTGGAAA TGAGGCTTAA AGAGGCTTAT AAAACCGTTG AAAAGGCGGA CAACCTTATC 
TCCCAGATTG GAATTTCCTT AAGCTATCTT ACCGGAGATC TTGAGAATGT CAGTTTGCAG 
ATTGAAGATA TGAAACAAAG GCGGCTTTTG GGGATTCGGA TAATAAAAGC CCAGGAAGAG 
GAGCGACAGA GGGTTGCAAG GGAAATTCAC GACGGTCCTG CCCAATCGAT GTCCAATATT 
GTTTTAAAAG CGGAAATATG CGAAAGATTG GTTGACTCTG ACCCGGAAAA GGCAAAAGAT 
GAGCTTAGAA CTTTAAAATC CGTTGTCAGA GACACTCTTC GGGATGTAAG GAAAATAATA 
TATGACTTAA GACCAATGTC ATTGGACGAC TTGGGTTTGA TACCAACCCT TCAAAGGTAT 
ATAGAGACTT GTCGGGAAGA ATCCGGAATA AAAATAACGT TTAAGACAAG AGGTACATGT 
GAGCAATTGA AACCTGTGGT TTCTTTGACC GTTTTCCGAC TTGTCCAGGA AGCAGTCAAT 
AATATTAAAA AGCATGCCCG TGCCGATAAA GTAACTATAA ATCTCGAATT TTTGGAAAAA 
GAATTAAAGC TCTATATAGC AGACAATGGA GTAGGTTTTG ACTTTGATTC TTTAAAATCA 
AACGAAGAGG ATATAAACAA AGGCTTCGGT CTTATAAGCA TGAGAGAAAG GGTTGAGCTT 
TTGGACGGCA AATTTGAGAT TGATTCTGCC GTTGGCAAAG GAACCAGACT TAATATAACT 
GTACCTTTAT TACCGGAAGA GGGGGTCTCA AATGGATAA

Protein sequence

MAGYKKVDTA NLDKIIKKTI EAINNSKAEL FDIAENARNE CVRLEKELEE LKRRTSEIIK 
SVETLEVALY ESKKRLMHVS RNYDKYSEEE LREAYENADN IRVELAIKRE REQYYIKRRN 
ELEMRLKEAY KTVEKADNLI SQIGISLSYL TGDLENVSLQ IEDMKQRRLL GIRIIKAQEE 
ERQRVAREIH DGPAQSMSNI VLKAEICERL VDSDPEKAKD ELRTLKSVVR DTLRDVRKII 
YDLRPMSLDD LGLIPTLQRY IETCREESGI KITFKTRGTC EQLKPVVSLT VFRLVQEAVN 
NIKKHARADK VTINLEFLEK ELKLYIADNG VGFDFDSLKS NEEDINKGFG LISMRERVEL 
LDGKFEIDSA VGKGTRLNIT VPLLPEEGVS NG