Gene GWCH70_2085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_2085
Symbol
ID	7977329
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	2157864
End bp	2159048
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	44%
IMG OID	644798903
Product	galactokinase
Protein accession	YP_002950063
Protein GI	239827439
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.11245
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCACCA ATTTAATAAA AACGTTTACT GAATTATTTG GAGACGGAAA TGAAGAAATT 
CGTATTTTCT TCGCGCCTGG CCGCGTGAAT TTAATTGGCG AGCATACGGA CTATAACGGC 
GGGCATGTGC TGCCGTGCGC TTTGGAAATT GGGACGTATG CGCTTGTGCG AAAAACAGCA 
CATCCGTTTA TCCGCTTTTA CTCAAAAAAT TTTCCGGAAA CAGGGATCAT TACCGTATCT 
TATGACGACC TATCCTACCA AGACAAGCAC GGATGGGCAA ATTATCCAAA GGGAGTTATT 
GCTGCGTTTC AATCGTTTTA TCCGATCGAG ACGGGACTTG ATATTTTGTA TTATGGAACG 
ATCCCGAACG GTGCCGGGTT ATCGTCTTCC GCTTCGATTG AATTAGTTAC GGCGGTGATG 
ATGAATGAGT TATTCGAGCA GCATATCGAT ATGCTCGAAC TTGTGAAAAT GAGCCAAAAA 
GTAGAAAATG AATATGTCGG CGTCAACTGC GGCATTATGG ATCAATTTGC CGTCGGAATG 
GGAAAGCGAA ATCATGCCAT TCTCTTAAAT TGCCAAACGC TGGCATACCG CTATATTCCT 
GTGGCGTTCA ATCATTGTTC GATTGTCATC GCAAATACGA ATAAAAAGCG CGGTTTGGCC 
GATTCAGCGT ATAACGAACG AAGATCGACG TGTGAAGCTG CGCTTTTGAA ATTAAAGGAG 
CATCTAAATA TCGAATCGCT TGGCGAGCTG ACAAGCGAGC AATTAGAACA GTATGATCAC 
CTTCTTTCTC CAATCGAACA AAAGCGAGCA CGCCATGCTG TGACGGAAAA TGAACGGACG 
ATTCAAGCGG CGGACGCATT AGAAAAAGGA GATTTGGCGC GCTTTGGCGA GTTAATGAAA 
CAATCCCACA TTTCGCTGCG CGATGATTAT GAAGTGACAG GATTAGAGCT TGATACGCTT 
GTTGAAGCGG CGTGGAACCA CGAAGGGACG ATCGGCGCCC GTATGACTGG AGCCGGTTTT 
GGCGGCTGTA CCGTAAATAT TGTAAAAGAT GAGTTCATTC CTTCTTTTAT TGAGCAAGTG 
GGGAATGAAT ATGCGAAAAA AATTGGCTAT GAAGCTAGTT TTTATGTTGT GAAAATTGGT 
GATGGAGCGA AAGAAATAAC GGGAGAAAAG GAGATGAGCG TATGA

Protein sequence

MITNLIKTFT ELFGDGNEEI RIFFAPGRVN LIGEHTDYNG GHVLPCALEI GTYALVRKTA 
HPFIRFYSKN FPETGIITVS YDDLSYQDKH GWANYPKGVI AAFQSFYPIE TGLDILYYGT 
IPNGAGLSSS ASIELVTAVM MNELFEQHID MLELVKMSQK VENEYVGVNC GIMDQFAVGM 
GKRNHAILLN CQTLAYRYIP VAFNHCSIVI ANTNKKRGLA DSAYNERRST CEAALLKLKE 
HLNIESLGEL TSEQLEQYDH LLSPIEQKRA RHAVTENERT IQAADALEKG DLARFGELMK 
QSHISLRDDY EVTGLELDTL VEAAWNHEGT IGARMTGAGF GGCTVNIVKD EFIPSFIEQV 
GNEYAKKIGY EASFYVVKIG DGAKEITGEK EMSV