Gene Teth514_1087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Teth514_1087
Symbol
ID	5876545
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoanaerobacter sp. X514
Kingdom	Bacteria
Replicon accession	NC_010320
Strand	+
Start bp	1123002
End bp	1124165
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	35%
IMG OID	641541441
Product	galactokinase
Protein accession	YP_001662721
Protein GI	167039736
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACGG CTGTAATTGA AGCACTTGAA AAATTCTACG GTAAAAATGA TGCTGAAATA 
AGGCTTTTCT ATTCTCCGGG ACGAGTGAAT CTTATTGGAG AGCATACAGA TTACAATGGA 
GGCTATGTAT TTCCTTGTGC CCTTGACTTT GGAACATATG CTGCGATTAG AAAAAGAAAT 
GACAAAAAAG TCTTCATGGC TTCTTTAAAT TTCGATTTAA AGGTGGAAGT AGACCTTGAT 
GCACTCAATT TTGATAAAAG CCATGATTGG GCTAATTATC CTAAAGGGGT TTTAAAAGTG 
TTACAGGATG AGGGGTATGA CTTTTCTGGA TTTGAAATTG TGTTTGAAGG CAACATTCCA 
AATGGCGCTG GACTTTCCTC ATCTGCTTCA ATAGAGCTGG TTACTGCTGT TGCAGTAAAT 
GAAGTTTTCA ATTTAAATAT TGACAGAATA AAATTGGTGA AATTGTGTCA AAAAGCAGAA 
AATACTTTTG TTGGGGTAAA TTGTGGCATA ATGGACCAAT TTGCTGTTGG AATGGGTAAA 
AAAGACCATG CTATTTTATT AAAAAGCGAT ACATTAGAGT ATTCATACGT GCCTTTGAAG 
TTAGAAGGTT ATAAAATTTT GATAACAAAT ACAAATAAAA GGAGAGGGCT CTTGGATTCG 
AAATATAATG AAAGAAGAAG TGAATGTGAA AAGGCCCTTT CATATCTTCA AAAAGCTTTG 
CCTGTAAAAA ATCTATCTGA AATTACAATT GAACAATTTG AAGAATACAA AGATTTGATA 
CCTGACGAAG TGCTTAGAAA AAGGGCAAAA CATGTTATAA CTGAAAATAA AAGAGTTTTA 
GATGCAGTAA AAGCACTTAA TGATAAAGAC TTAATCAAAT TTGGAGAATT AATGGTTGAA 
TCTCACAATT CTTTGAGAGA TGATTACGAA GTTACAGGGA AAGAACTGGA CACTTTGGTA 
GAAGAAGCGT TAAAATTAAA GGGAGTAATA GGTTCCCGTA TGACTGGAGC AGGCTTTGGT 
GGCTGCACTG TAAGCATTGT AAAAGAAGAT GCAGTAGAGG AATTTATAAA AGTGGTGACT 
CACAATTACA CTCAAAAAAT AGGCTACAGG CCAACAGTCT ATATAACGGG AATAGGTGAA 
GGAGCAGGAG AAATTAAATA CTGA

Protein sequence

MKTAVIEALE KFYGKNDAEI RLFYSPGRVN LIGEHTDYNG GYVFPCALDF GTYAAIRKRN 
DKKVFMASLN FDLKVEVDLD ALNFDKSHDW ANYPKGVLKV LQDEGYDFSG FEIVFEGNIP 
NGAGLSSSAS IELVTAVAVN EVFNLNIDRI KLVKLCQKAE NTFVGVNCGI MDQFAVGMGK 
KDHAILLKSD TLEYSYVPLK LEGYKILITN TNKRRGLLDS KYNERRSECE KALSYLQKAL 
PVKNLSEITI EQFEEYKDLI PDEVLRKRAK HVITENKRVL DAVKALNDKD LIKFGELMVE 
SHNSLRDDYE VTGKELDTLV EEALKLKGVI GSRMTGAGFG GCTVSIVKED AVEEFIKVVT 
HNYTQKIGYR PTVYITGIGE GAGEIKY