Gene Huta_3018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_3018
Symbol
ID	8385327
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	-
Start bp	3109376
End bp	3110461
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	62%
IMG OID	644974096
Product	galactokinase
Protein accession	YP_003131912
Protein GI	257054079
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCGATT TCGAAGGGGA CTATACTGTC CGTTCCCCGG GTCGCGTCAA TCTGATCGGG 
GGCCACACTG ACTACACACT CGGGTACGTG ATGCCACTGG CGACGGATCT GCAGACGCGA 
CTCGAAGCGA CCGAGAGCGA GGACGTACAC GTGTCTTCGA CCGCGGTCGA ATCGAGCTAT 
TCGTTCGCGA CCGACGATCT GGAACCAGTC GAGGACTGGG TCGACTACGT CAAAGGCTGT 
TATGCTATCT TACAGGCGGC GGGATACGAT CCCGGCGGCT TTCGCGGCGA CATCACCACG 
AAACTGCCGA TCGGGGCCGG GTTGAGTTCC TCGGCGAGCC TGGAGCTTGC GGTCATGGCA 
CTGTTGAACG AGGCATACGA CCTTGGCCTC TCGCGGGAGC GAATGGCGCG GCTGAGTCAG 
CGTGTCGAGA ACGACTACGT CGGGGTGGCC TGTGGGATCA TGGACCAGTT TGCCGTGGCA 
CTCGGGCAGG ACGGCCACGC ACTCTCGATC GACACTGAAA CACTGACGTA CACGCCAGTC 
CCGTTTCCGG ACGGAATCGA GATCCTGGTC TTTCACACCG GTGTCTCCCG GGGATTGGTC 
GAGTCGGCCT ACAACCAGCG TCGGGAGACC GTCGAGGGTG CGCTCGAGAA GCTGGACGTC 
GATTCGTCGA AAGACGTTTC GGAGGGGGAT CTGCACGGGC TTGATCCGCT GGAGCGAGAG 
CGACTCGGGT ACGTCGTCCG GGAGAACGCT CGCGTCCAAC GGGCGCAGGC GGCACTCGAA 
GACGGGGAGA TTCAGACGTT CGGGGAGATA CTTCTCTCCG CACACCGGGA CATCGCCGAC 
CACTACGACG CCAGCTGTAA AGAACTGGAT TTCGTCGTCG AGACGGCCCT CGAGGCTGGA 
GCCTACGGGG CACGATTGAC TGGTGCTGGG TGGGGTGGGG CGGCGATCGC CGTCGTCGAC 
ACTGAAACCG TCGAATCGGT CGCCACGTCC ATCGAAGCGG CGTATCGAGA ACAGTTCCCG 
GAACACGATC CCCACTACTA CCGCATCGAA GCTGCGGACG GCGTCCGAGT GACACACACT 
GGTTGA

Protein sequence

MVDFEGDYTV RSPGRVNLIG GHTDYTLGYV MPLATDLQTR LEATESEDVH VSSTAVESSY 
SFATDDLEPV EDWVDYVKGC YAILQAAGYD PGGFRGDITT KLPIGAGLSS SASLELAVMA 
LLNEAYDLGL SRERMARLSQ RVENDYVGVA CGIMDQFAVA LGQDGHALSI DTETLTYTPV 
PFPDGIEILV FHTGVSRGLV ESAYNQRRET VEGALEKLDV DSSKDVSEGD LHGLDPLERE 
RLGYVVRENA RVQRAQAALE DGEIQTFGEI LLSAHRDIAD HYDASCKELD FVVETALEAG 
AYGARLTGAG WGGAAIAVVD TETVESVATS IEAAYREQFP EHDPHYYRIE AADGVRVTHT 
G