Gene GWCH70_3044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_3044
Symbol
ID	7977407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	3061691
End bp	3062836
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	43%
IMG OID	644799838
Product	Sensor DegS domain protein
Protein accession	YP_002950977
Protein GI	239828353
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000000367044
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTTCAA ATAAAACGTT GGATGCAAAA GAATTAGATA AAATTGTCGA AAAAATGATC 
GACACCGTTC AACATAGCAA GGACGAAATT TTTCGGATCG GTGAACAGTC ACGCCAAGAA 
CATGAACAGC TGCTTCAAGA ATTGATGGAA GTGAAGATGC TAACCAAACA GACGATTGAA 
GAGGCGGATA AACTGGAAAT ACAAACCCGG CTGTCTCGGC AGCGCCTTGC GGAAGTAAGC 
AAGGATTTTT CGCTATATTC GGAAGAGGAA ATTCGTGAAG CATACGAAAA GGCCCATGAA 
TTGCACATGG AGCTGGCGAT GATCCGCGAG CGGGAAAAAC AGCTGCGGCT GCGGCGCGAT 
GAGCTCGAGC GGCGCTTAGT TGGGCTGAAG GAAACGATCG AACGGGCAGA GCATTTAGTT 
GGACAAATTA CGGTTGTTCT TGATTATTTA AACAGCGACT TCCGTCAAGT GGGGGAATTT 
ATTGAAGGGG CTAAACAAAA ACAAGAGTTT GGGTTAAAAA TTATCGAGGC GCAAGAAGAG 
GAAAGAAAAC GGCTATCGCG GGAAATTCAT GATGGTCCGG CGCAAACGCT CGCCCATGCC 
ATTCTTCGTT CCGACTTCAT TGAAAAAGTG TTAAAAGATC GCGGTATTGA AGCGGCGATT 
GCCGAAATTC GCGATTTTAA AAAAATGGTT CGTTCTGCTC TTTATGAGGT ACGAAGAATT 
ATTTATGATT TGCGACCAAT GGCGCTTGAC GATTTAGGTT TAATTCCTAC ACTAAGAAAA 
TACCTACAAA CGATCGAAGA TTATAATAGG GAGATTGCCG TCTCCTTTGT ACACATTGGT 
GAAGAAGTAA GACTACCGGC CCGAATGGAA GTTGCGGTGT TCCGTCTCGT TCAAGAATCA 
GTACAAAATG CCCTAAAGCA TGCGGAAGCG ACCGAAATTC AAGTGAGAAC GGAAATGAAT 
AACAACCAGC TGTTTGTGAT GGTAAAAGAT AATGGGAAAG GATTTGACAC AACGGTAAAA 
AAAGAGAATG CTTTTGGACT TATTGGCATG AAAGAACGGG TCGAATTGTT GGAAGGGACA 
TTAACGATTC GGTCAAAGAT TGGATTCGGT ACAACGATTT TCATTCGTAT TCCGTTAAAT 
GTATAA

Protein sequence

MSSNKTLDAK ELDKIVEKMI DTVQHSKDEI FRIGEQSRQE HEQLLQELME VKMLTKQTIE 
EADKLEIQTR LSRQRLAEVS KDFSLYSEEE IREAYEKAHE LHMELAMIRE REKQLRLRRD 
ELERRLVGLK ETIERAEHLV GQITVVLDYL NSDFRQVGEF IEGAKQKQEF GLKIIEAQEE 
ERKRLSREIH DGPAQTLAHA ILRSDFIEKV LKDRGIEAAI AEIRDFKKMV RSALYEVRRI 
IYDLRPMALD DLGLIPTLRK YLQTIEDYNR EIAVSFVHIG EEVRLPARME VAVFRLVQES 
VQNALKHAEA TEIQVRTEMN NNQLFVMVKD NGKGFDTTVK KENAFGLIGM KERVELLEGT 
LTIRSKIGFG TTIFIRIPLN V